#エンベディング

4件の記事

「ChatGPTはどのようにうごいているか？」を読んで

2017年の「Attention Is All You Need」論文がAI業界の起源であること、その著者たちが現在のOpenAIやGoogleなど各社を牽引していることを再発見できる一冊です。本は四則演算から始まり、行列・ベクトル・ニューラルネットワーク・Transformerへと段階的に解説。特にエンベディングで「意味」をベクトル化する仕組みが腑に落ちます。ChatGPTの動作原理を数式ではなく直感的に理解したいエンジニアに最適です。

#Transformer #モデル・基盤 #機械学習基礎

記事を読む →

📚

Qiita3月30日· 2分で読める上級🔥 注目

Amazon Bedrock Knowledge Bases × OpenSearch Serverless を使用して日本語RAGの精度を引き出す

日本語RAGの精度が英語よりも低くなる根本原因は言語特性にあります。トークン分割やエンベディング品質、検索パラメータが日本語に最適化されていないことが問題です。本記事では、Amazon BedrockとOpenSearch Serverlessを使い、MIRACL-jaデータセットで200クエリを実測評価。Recall@10やMRR@10などの指標を追跡しながら、日本語特有のパラメータチューニング方法を実践的に解説しており、実装者が「動くRAG」から「使えるRAG」へ進化させるための具体的なノウハウが得られます。

#RAG #日本語処理 #ベクトル検索

記事を読む →

📚

Qiita3月19日· 1分で読める上級🔥 注目

生成AIで使われるRAGとは

RAGの仕組みを、Azureの実画面を使って具体的に解説した記事です。テキストをベクトル化し、意味的類似性で検索する仕組みから、iPaaSを使ったインデクシング、実際のベクトル検索まで、企業のAI活用に必須の技術を手を動かしながら学べます。ハルシネーション抑制の実装方法が分かります。

#RAG #ベクトル検索 #技術・実装

記事を読む →

🧠

Qiita3月6日· 2分で読める上級

【考察】LLMは現代の「SECIモデル」を駆動するエンジンである：暗黙知と形式知、そしてエンベディング空間の交差点

野中郁次郎のSECIモデル（暗黙知と形式知の循環）を、LLMとの相互作用に当てはめた考察です。LLMはエンベディング空間で人間の言語化できない思考を形式知に射影する「関数」として機能し、比喩的なプロンプト入力から構造化された出力まで、知識創造のループが個人レベルで高速化していると指摘します。人間とLLMの対話が新しい思考空間を拓く可能性を論じており、認知科学とビジネス理論の交点から現代的な知識創造を再定義しています。

#LLM #知識創造 #プロンプトエンジニアリング

記事を読む →