広告です。クリックいただけると励みになります。

人気記事(昨日)

    2026年05月31日

    超並列処理ってどれくらい超越しているの?

    manuel-torres-garcia-wt8QIwUEJvw-unsplash.jpg

    質問

    超並列処理ってどれくらい超越しているの?


    超越者となったおっさんはマイペースに異世界を散策する5 【電子書籍】[ 石田総司 ]

    価格:748円
    (2026/5/31 11:33時点)
    感想(0件)


    解答

    「超並列処理」は文脈によってかなり幅があります。

    例えば一般的なサーバだと、

    CPU 16コア

    なら16個前後の処理を同時実行できます。

    これは普通の並列処理。

    一方、クラウドやGPUの世界になると桁が変わります。

    例えばGPUは、

    数千〜数万個の演算器

    を持っています。

    AI学習では、

    GPU 1000台×各GPU数千演算器

    のような構成もあります。

    すると理論上は数百万〜数千万単位の演算が同時進行します。

    AWSの例

    例えばLambdaは、

    1リクエスト = 1実行環境

    なので、

    数万〜数十万リクエスト

    を並列処理する設計が可能です。

    MapReduce系やEMRでは、

    数百〜数千ノード

    で巨大データを分割処理します。

    「超並列」がすごい理由

    例えば1億件のデータを処理するとして、

    1台で1秒1000件なら:

    100,000秒

    かかる。

    でも1000台で完全並列なら:

    100秒

    まで短縮できる。

    もちろん実際は通信や同期のオーバーヘッドがあるので理想通りにはなりません。

    現代のAIでの規模感

    最先端のAI学習では、

    数万GPU

    規模が使われることがあります。

    これは昔のスーパーコンピュータ級です。

    なので「超並列処理」という言葉は、

    数十並列

    ではなく、

    数千〜数万、場合によっては数百万単位の処理を同時に走らせる世界

    を指すことが多いです。







    機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック [ 森下光之助 ]

    価格:2948円
    (2025/5/15 09:53時点)
    感想(0件)


    ニュートン式 超図解 最強に⾯⽩い!! ベクトル

    価格:990円
    (2025/5/15 10:00時点)
    感想(0件)


     



    ブログランキング・にほんブログ村へ
    【下記、広告です。クリックいただけると励みになります。】
    posted by モニー at 11:35| Comment(0) | AI・機械学習 | このブログの読者になる | 更新情報をチェックする

    2026年05月09日

    ragにはどんな種類がある?

    brotherhood-studio-839Lg5v1es4-unsplash.jpg

    質問

    ragにはどんな種類がありますか?


    LLMの原理、RAG・エージェント開発から読み解く コンテキストエンジニアリング [ 蒲生 弘郷 ]

    価格:3300円
    (2026/4/24 20:14時点)
    感想(0件)


    解答

    RAGは1種類ではなく、**「どう検索するか」「どう使うか」「どう構成するか」**でいくつかの型に分かれます。

    整理しておくと理解しやすいです。


    1. 基本型(Naive RAG)

    一番シンプルな形です。

    • クエリをベクトル化

    • 類似検索

    • 上位k件をそのままプロンプトに入れる

    特徴:

    • 実装が簡単

    • ただし精度はそこそこ


    2. 高度検索型(Advanced RAG)

    検索部分を強化したものです。

    • ハイブリッド検索(ベクトル + キーワード)

    • リランキング(一度広く取ってから並び替え)

    • クエリ拡張(質問を言い換えて検索)

    特徴:

    • 精度が上がる

    • 構成は少し複雑


    3. 再帰・多段型(Multi-step RAG)

    1回の検索で終わらせないタイプ。

    流れ

    1. 質問を分解

    2. それぞれ検索

    3. 結果を統合

    例:

    • 「AとBの違いは?」→ AとBを別々に検索

    特徴:

    • 複雑な質問に強い

    • 遅くなりがち


    4. Agent型RAG

    LLMが「どう検索するか」自体を考えるタイプ。

    • 必要に応じて検索

    • 複数回検索

    • ツールを選択

    特徴:

    • 柔軟で賢い

    • ただし制御が難しい


    5. Graph RAG

    データをグラフ構造で持つタイプ。

    • エンティティ同士の関係を保持

    • 関係性ベースで検索

    特徴:

    • 知識のつながりを扱える

    • ナレッジベース用途に強い


    6. Long-context RAG

    検索を減らして

    • 長い文脈をそのまま入れる

    特徴:

    • 構成がシンプル

    • モデル性能に依存


    7. Memory型RAG

    会話履歴やユーザー情報を使うタイプ。

    • 過去のやり取りを検索対象にする

    特徴:

    • パーソナライズに強い


    8. 事前処理強化型(Preprocessing-heavy)

    検索前の準備に力を入れるタイプ。

    • チャンク最適化

    • メタデータ付与

    • 要約を保存

    特徴:

    • 精度が安定

    • 初期コストが高い


    まとめ(整理)

    ざっくり分類するとこうなります:

    • シンプル:Naive RAG

    • 精度強化:Advanced RAG

    • 複雑質問:Multi-step / Agent

    • 構造重視:Graph RAG

    • 文脈重視:Long-context

    • 個人化:Memory型


    本質

    全部に共通するのはこれです:

    「必要な情報をどうやって取り出し、どうLLMに渡すか」

    つまりRAGの性能は

    • 検索精度

    • 文脈の渡し方

    でほぼ決まります。




    イラストでそこそこわかるネットワークプロトコル 通信の仕組みからセキュリティのきほんのきまで【電子書籍】[ 川島拓郎 ]

    価格:3080円
    (2026/4/11 21:00時点)
    感想(0件)



     



    ブログランキング・にほんブログ村へ
    【下記、広告です。クリックいただけると励みになります。】
    posted by モニー at 10:00| Comment(0) | AI・機械学習 | このブログの読者になる | 更新情報をチェックする

    2026年05月07日

    AIって機械語読めます?

    zoltan-tasi-7qhm0GNurTc-unsplash.jpg

    質問

    AIって機械語読めます?


    [新品]ドラえもん (0-45巻 全巻) 全巻セット

    価格:27500円
    (2026/4/23 19:37時点)
    感想(51件)

    STARWARS R2-D2 ゴミ箱 ハートアートコレクション

    価格:160367円
    (2026/4/23 19:38時点)
    感想(0件)


    解答

    結論から言うと、読めます。

    ただし「人間がソースコードを読む感覚」とは少し違います。


    ① 機械語は読めるのか?

    はい、可能です。

    AIは

    • 16進数のバイト列(例:B8 01 00 00 00

    • バイナリ列

    を入力として受け取り、それを

    • アセンブリに変換したり

    • 処理内容を推定したり

    できます。


    ② ただし「理解の仕方」が違う

    人間は

    → 命令セットを知識として理解して読む

    AIは

    → 大量のパターンから「この並びはこういう動きっぽい」と推定する

    つまり、

    意味を“論理的に逐一解釈”というより、“統計的に解釈”しているイメージです。


    ③ 限界もある

    ここが重要です。

    ● 文脈がないと厳しい

    機械語単体だと

    • OS依存

    • CPUアーキテクチャ依存(x86 / ARMなど)

    • メモリ配置

    が分からないと正確な解釈が難しい。


    ● 最適化済みコードは難解

    コンパイラ最適化された機械語は

    • 人間でも読みにくい

    • 意図が潰れている

    ため、AIでも完全理解は難しい場合があります。


    ● 完全な逆コンパイルは難しい

    機械語 → 元の高級言語(変数名・構造)
    は情報が失われているため、完全復元は不可能です。


    ④ 実務的にはどう使われる?

    • マルウェア解析

    • リバースエンジニアリング補助

    • 脆弱性調査

    • デコンパイル支援

    などでかなり有用です。


    ⑤ まとめ

    • 機械語は読める

    • ただし「完全理解」ではなく「推定に近い」

    • 文脈があるほど精度が上がる





    雑に作る 電子工作で好きなものを作る近道集 [ 石川 大樹 ]

    価格:2640円
    (2025/5/12 10:47時点)
    感想(0件)


    2001年宇宙の旅決定版 (ハヤカワ文庫) [ アーサー・チャールズ・クラーク ]

    価格:990円
    (2025/7/24 15:23時点)
    感想(5件)


     



    ブログランキング・にほんブログ村へ
    【下記、広告です。クリックいただけると励みになります。】
    posted by モニー at 10:00| Comment(0) | AI・機械学習 | このブログの読者になる | 更新情報をチェックする

    2026年02月28日

    AIのハルシネーションは問題視されますが、そもそも人間だってハルシネーションしますよね?

    anoof-c-YzUyolf8rUI-unsplash.jpg

    質問

    AIのハルシネーションは問題視されますが、そもそも人間だってハルシネーションしますよね?

    解答

    とても本質的な問いですね。
    結論から言うと――

    はい、人間も「ハルシネーション(もっと広い意味での誤った確信)」を日常的に起こします。
    ただし、AIのそれとは性質がかなり違います。

    整理してみましょう。


    1. まず「ハルシネーション」とは何か?

    AI文脈でのハルシネーションは:

    もっともらしく、しかし事実ではない内容を生成してしまうこと

    一方、人間の場合は:

    • 記憶の捏造

    • 思い込み

    • バイアス

    • 錯覚

    • デマの拡散

    • 自信過剰な誤認

    などが該当します。

    実際、心理学では:

    • 記憶は再生ではなく「再構築」

    • 人は自分の間違いを強く確信する

    ことが知られています。


    2. 人間のハルシネーションの特徴

    ① 自信と正確性は相関しない

    強く確信している人ほど間違っていることも多い。

    ② 物語を作る傾向

    断片情報からストーリーを補完する。

    ③ 集団で強化される

    SNSやコミュニティで誤情報が増幅。

    ④ 記憶は編集される

    後から都合よく書き換わる。

    つまり人間は:

    「意味を作る機械」

    であり、その副作用が誤認です。


    3. ではAIとの違いは?

    ここが重要です。

    観点人間AI
    経験実体験あり実体験なし
    感情ありなし
    動機自己防衛・承認欲求なし
    責任法的・倫理的責任あり設計者側に責任
    修正恥や学習で修正再学習しない限り構造的に同じ

    AIの誤りは:

    「確率的生成の副作用」

    人間の誤りは:

    「認知構造の副作用」


    4. 決定的な違い

    人間は:

    • わからないと黙ることができる

    • 恥を感じる

    • 信頼を失うと社会的損失がある

    AIは:

    • わからなくても出力する

    • 自信の度合いを自然に表現できない

    • 恥も責任も感じない

    ここが社会的リスクの差になります。


    5. 面白い逆転

    実は一部の研究では:

    人間のほうがAIより自信過剰

    という結果もあります。

    つまり:

    • 人間は「間違いを信じる」

    • AIは「確率的に間違う」

    という違いです。


    6. 本質的な問い

    この議論は結局こうなります:

    私たちは「真実」よりも「もっともらしさ」に弱いのではないか?

    人間の脳もAIも、

    不完全情報から「もっともらしい推論」をする装置です。

    違いは:

    • 人間は意味・感情・社会的欲望を持つ

    • AIは統計的パターンに従う


    7. さらに深い視点

    むしろ怖いのは:

    AIのハルシネーションより、人間がそれを信じること

    です。

    人間側の認知バイアスがある限り、
    AIの誤りは増幅されます。




    やさしく学ぶLLMエージェント ー基本からマルチエージェント構築までー【電子書籍】[ 井上顧基 ]

    価格:3520円
    (2025/7/2 17:20時点)
    感想(0件)


    ディープラーニングを支える技術 --「正解」を導くメカニズム[技術基礎] [ 岡野原 大輔 ]

    価格:2948円
    (2023/12/24 13:47時点)
    感想(0件)


     



    ブログランキング・にほんブログ村へ
    【下記、広告です。クリックいただけると励みになります。】
    posted by モニー at 14:00| Comment(0) | AI・機械学習 | このブログの読者になる | 更新情報をチェックする

    2025年11月24日

    強いAIと弱いAIとは?

    guillaume-de-germain-3BwoPWguMic-unsplash.jpg

    質問

    強いAIと弱いAIとは?


    解答

    「強いAI(Strong AI)」と「弱いAI(Weak AI)」は、AIの“能力の範囲”や“目指すゴール”を区別するための概念です。
    技術的な分類というより「哲学的・概念的」な区別として使われます。


    弱いAI(Weak AI)

    定義

    特定のタスクを効率よく行うために作られたAI。
    目的特化型で、人間のような意識や自我は持たない。


    特徴

    * 何かに「特化」している

    例:画像認識、音声認識、将棋AI、検索エンジン、チャットボット
    * 決められた範囲でのみ非常に強い
    * 世界全体を理解しているわけではない * 自律的な意識・感情・意図は持たない


    * 囲碁AI(AlphaGo)
    * Amazonの推薦エンジン
    * Siri、Google Assistant
    * ChatGPT(現在のAIはすべて弱いAIの範囲)

    強いAI(Strong AI)

    定義

    人間と同等の知性・意識・自我・理解力を持つAI。
    哲学的には「思考できる機械」「意識を持つ機械」。
    現在の技術では存在しません。


    特徴

    * 人間と同じように世界を理解する
    * 自律的に目的を設定して行動できる
    * 感情や意図を「本質的に」持ちうる(と考えられている)
    * 汎用的で、多様な問題を自力で学習・解決できる


    (未来の想像)
    * 完全に人間と対話でき、人格を持つAI
    * 新しい科学理論を自立的に発見するAI
    * ロボットとして社会に統合し、自律的判断を行うAI

    まとめ

    観点弱いAI強いAI
    能力タスク特化人間レベルの汎用知能
    意識なしあり(と想定)
    ChatGPT、検索、囲碁AISFに登場する人格AI
    実現状況すでに存在・普及未実現(理論段階)


    現代のAI(例えばChatGPT)はどちら?

    → 弱いAI
    理由:
    * 自分の意志や意識はない
    * タスクごとに訓練されており、世界を主観的に理解しているわけではない
    * 汎用のように見えても、背後には膨大なパターン学習と統計処理がある






    RISABOOO 1st写真集「弱肉強食」 デジタル版【電子書籍】[ RISABOOO ]

    価格:2200円
    (2025/11/17 20:42時点)
    感想(0件)


    富士山噴火【電子書籍】[ 高嶋哲夫 ]

    価格:891円
    (2025/11/15 09:50時点)
    感想(0件)


     



    ブログランキング・にほんブログ村へ
    【下記、広告です。クリックいただけると励みになります。】
    posted by モニー at 15:00| Comment(0) | AI・機械学習 | このブログの読者になる | 更新情報をチェックする

    2025年09月29日

    Praquetファイルとはなんですか?

    sumup-nedMerQvxWQ-unsplash.jpg

    質問

    Praquetファイルとはなんですか?


    解答

    Parquetファイルとは

    * Apache Parquet は、Hadoopエコシステム発の 列指向(columnar)形式のデータストレージファイル です。
    * CSV や JSON のような行指向の形式と違い、同じ列のデータをまとめて格納するため、特に分析処理や集計処理に強いのが特徴です。


    特徴

    1. 列指向ストレージ
    * 必要な列だけを読み込めるため、大規模データでも効率的。
    * 例:数十列あるテーブルから「年齢」列だけを読む場合、CSVより圧倒的に速い。

    2. 高圧縮・高効率
    * 同じ列には同じ型・似たようなデータが多いため、圧縮効率が良い。
    * ディスク容量の節約や I/O コスト削減につながる。

    3. スキーマを持つ
    * 列ごとに型情報(int, string, boolean など)を保持するため、型付きデータ処理が可能。

    4. ビッグデータ処理に最適化
    * Spark、Hive、Presto、Pandas など多くの分析基盤やライブラリでネイティブサポートされている。


    主な用途

    * データレイクやDWHでの保存形式(例:AWS S3, Google BigQuery などで利用)。
    * Apache Spark / Hadoop でのバッチ分析。
    * Python(pandas, pyarrow)での高速データ処理。


    🔹まとめると:

    Parquetファイルは、ビッグデータ処理や分析に適した「列指向・高圧縮・スキーマ付き」のデータ形式です。
    CSVやJSONより効率的に扱えるため、最近のデータ分析やクラウド環境では標準的に使われています




    Digital Soul Somewhere between a dataset and a syntax tree, a soul was born.【電子書籍】[ Mohammed Ibrahim ]

    価格:806円
    (2025/9/5 20:08時点)
    感想(0件)


    メディコス・エンタテインメント 超像可動 ジョジョの奇妙な冒険 第6部 ストーンオーシャン Ws (ホワイトスネイク) フィギュア (ZF107371)

    価格:6780円
    (2024/11/2 01:45時点)
    感想(1件)


     



    ブログランキング・にほんブログ村へ
    【下記、広告です。クリックいただけると励みになります。】
    posted by モニー at 18:00| Comment(0) | AI・機械学習 | このブログの読者になる | 更新情報をチェックする

    2025年05月26日

    AIがファクトチェックする際は、どのようなメソッドが働いていますか?

    muriel-liu-xTv7HFeP3FE-unsplash.jpg

    質問

    AIがファクトチェックする際は、どのようなメソッドが働いていますか?


    解答

    AIがファクトチェックを行う際には、複数の技術やメソッドが組み合わさって働いています。
    以下は代表的なメソッドや仕組みです:

    1. 情報抽出(Information Extraction)

    * 入力された文から「主張(claim)」を抽出します。
    * 例:「○○は2020年に起きた」は、時系列と出来事に関する主張。


    2. 文脈理解と言語モデルの活用

    * 文の構造や意味をAIが理解するために、BERTやGPTなどの大規模言語モデルを使用。
    * 意味的に類似する情報や反証を含む文を探す基盤になります。


    3. データベース・知識ベース照合

    * 抽出した主張と照らし合わせるために、次のような情報源を利用します:

    * 信頼性のあるニュースメディア(例:BBC, NHK)
    * WikipediaやWikidataなどの構造化知識
    * 科学論文や政府統計などの公的データ
    * ファクトチェック専門サイト(Snopes, PolitiFactなど)


    4. 類似情報の検索と照合(Retrieval & Matching)

    * ベクトル検索(semantic search)を用いて、類似内容の文書を検索。
    * 「主張」と「情報源」の一致度を自然言語処理で計算(例:cosine similarity)。


    5. 真偽判定(Veracity Classification)

    * AIは複数の候補文と照らし合わせて、以下のようにラベルを付けます:

    * True(正確)
    * False(誤り)
    * Partially True(部分的に正しい)
    * Unverified(確認不能)
    * これには「自然言語推論(NLI)」技術が使われます。


    6. 説明生成(Explainability)

    * ユーザーに結果を提示する際、なぜその結論になったかを生成AIで説明。


    例:

    > 「地球は平らである」は主張。

    > → WikipediaやNASAサイトの情報と照合。

    > → 科学的なコンセンサスと一致しないため「False」と判断。

    > → 補足として「観測された地平線の曲率」「人工衛星の写真」などが提示される。


    注意点:

    * AI単独ではファクトチェックの最終判断者にはなれません。
    * 情報源の信頼性、更新頻度、政治的バイアスなども人間のレビューが重要です。







    真実 Blu-ray スタンダード・エディション【Blu-ray】 [ カトリーヌ・ドヌーヴ ]

    価格:4224円
    (2025/5/18 14:07時点)
    感想(0件)


    大学4年間のデータサイエンスが10時間でざっと学べる (角川文庫) [ 久野 遼平 ]

    価格:704円
    (2023/11/14 12:56時点)
    感想(0件)


     



    ブログランキング・にほんブログ村へ
    【下記、広告です。クリックいただけると励みになります。】
    posted by モニー at 15:00| Comment(0) | AI・機械学習 | このブログの読者になる | 更新情報をチェックする