LLMの性能をスクリプトで採点できるようにしてみた

Zenn4月10日· 1分で読める中級🔥 注目

ベクトル検索は不要なのか

ベクトル検索は不要ではなく、使い分けが重要です。従来のベクトル型RAGは大規模データで有効一方、Agentic RAGやファイル検索型RAG、階層的検索など新しいアプローチが登場し、データの性質や要件で最適な手法を選択する時代へ。A-RAGやDeepReadなどの最新事例から、精度とスループットを両立させる道筋が見えてきます。

#RAG #エージェント #技術・実装

記事を読む →

Qiita4月10日· 1分で読める中級🔥 注目

教育を「最短経路問題」として解いてはいけない理由 ── 近代教育の父ペスタロッチ vs 6人のAI

AIが教育に用いられる際、即座に正解を与える「親切」が学習者の思考プロセスを奪ってしまう危険性を指摘します。ペスタロッチの知・情・意の3層モデルを軸に、Gemini・ChatGPT・Claude等6体のLLMと対話し、AIこそが「不便さ」を意図的に設計することで真の教育的支援ができると主張する、エンジニア向けの深い考察です。

#AI駆動開発 #ChatGPT #Claude

記事を読む →

Qiita4月10日· 2分で読める中級🔥 注目

「オープンソースAIこそ正義」って言ってたじゃないか、、、ザッカーバーグが、クローズドモデルを出した日 ─ Meta Muse Sparkの全貌

Metaが2026年4月にクローズドソースの推論モデル「Muse Spark」を発表し、オープンソース路線からの転換を宣言しました。Llama 4失敗と中国勢の追い上げにより、戦略を変更。52点のベンチマークでGPT-5.4に肉薄し、医療・科学推論で強さを発揮する一方、コーディングで弱点を持ちます。Llama 4 Maverickと同等性能を10分の1以下の計算量で実現する「Contemplatingモード」が技術的特徴です。

#LLM #Meta #モデル・基盤

記事を読む →

LLMの性能をスクリプトで採点できるようにしてみた

関連記事

1人でAIチームを作る方法（PM・エンジニア・レビュアー）

ベクトル検索は不要なのか

教育を「最短経路問題」として解いてはいけない理由 ── 近代教育の父ペスタロッチ vs 6人のAI

「オープンソースAIこそ正義」って言ってたじゃないか、、、ザッカーバーグが、クローズドモデルを出した日 ─ Meta Muse Sparkの全貌