LLM News
モデル・基盤AI駆動開発技術・実装エージェントビジネス・活用
📅 今日のまとめ♡☆

LLM News

LLM・VibeCoding・AI駆動開発に関する最新記事をキュレーションしてお届けします。

𝕏RSS

ナビゲーション

  • トップ
  • タグ一覧
  • 検索
  • About
  • プライバシーポリシー

人気タグ

#LLM#Claude#VibeCoding#AI駆動開発#RAG#エージェント#プロンプトエンジニアリング#GPT-4

© 2026 LLM News

← トップへ

#日本語処理

2件の記事

関連タグ

#LLM#ベンチマーク#モデル選定#コーディング#推論#RAG#ベクトル検索#OpenSearch#AWS Bedrock#エンベディング
🧠
Qiita4月3日· 2分で読める中級🔥 注目

ユースケース別 LLMベンチマーク読解ガイド

ベンチマークスコアを鵜呑みにしてはいけません。本記事は、コーディング・日本語・推論など用途別に「どのベンチマークを信じるべきか」を整理しています。SWE-bench、AIME、JGLUEといった具体的なベンチマーク名と、各々の弱点を解説。最終的には「自分のタスクで実際に試すこと」が最も信頼できるという現実的な指針を示しており、モデル選定の際の羅針盤になります。

#LLM#ベンチマーク#モデル選定
記事を読む →
📚
Qiita3月30日· 2分で読める上級🔥 注目

Amazon Bedrock Knowledge Bases × OpenSearch Serverless を使用して日本語RAGの精度を引き出す

日本語RAGの精度が英語よりも低くなる根本原因は言語特性にあります。トークン分割やエンベディング品質、検索パラメータが日本語に最適化されていないことが問題です。本記事では、Amazon BedrockとOpenSearch Serverlessを使い、MIRACL-jaデータセットで200クエリを実測評価。Recall@10やMRR@10などの指標を追跡しながら、日本語特有のパラメータチューニング方法を実践的に解説しており、実装者が「動くRAG」から「使えるRAG」へ進化させるための具体的なノウハウが得られます。

#RAG#日本語処理#ベクトル検索
記事を読む →