#ハルシネーション

9件の記事

geminiへの「拠」入力について

Geminiに特定の文字「拠」を繰り返し入力するとモデルが暴走し、無関係な文章を生成する現象が報告されています。これはdivergence attackと呼ばれる既知の攻撃手法で、LLMの安全性検証において重要な事例です。プロンプトインジェクションやモデルの脆弱性理解に役立つ内容です。

#Gemini #LLM安全性 #プロンプトインジェクション

記事を読む →

⚡

Qiita4月8日· 1分で読める中級🔥 注目

【Whisper API】無音時に「ご視聴ありがとうございました」？ハルシネーション対策まとめ

Whisper APIが無音データから「ご視聴ありがとうございました」などYouTube的なフレーズを勝手に生成する問題に直面した開発者による実装レポートです。no_speech_probの閾値チェック（0.5以上）とパターンマッチングの2層防御で対策。学習データの偏りが生む具体的なハルシネーション例と、本番環境で使える検出コード付きです。

#Whisper API #ハルシネーション #音声認識

記事を読む →

⚡

Qiita4月7日· 1分で読める中級🔥 注目

AIの言う通りに `npm install` したら、存在しないはずのパッケージ経由でマルウェアに感染しかけた話（AIパッケージハルシネーション）

AIが存在しないパッケージを自信満々に推薦し、攻撃者がそのハルシネーション名で先回りしてマルウェアを登録する「AIパッケージハルシネーション攻撃」の実例報告です。コピペしたコマンド一つで感染しかけた経験から、公式リポジトリでの「生存確認」の重要性を具体的に解説しており、AI駆動開発時代の現実的なセキュリティリスクを学べます。

#セキュリティ #AI駆動開発 #ハルシネーション

記事を読む →

✍️

Qiita3月28日· 1分で読める中級

AIのハルシネーションは「Yahoo!知恵袋」の夢を見るか？〜幻覚を「人間味」に変換するプロンプト設計〜

AIのハルシネーションと知恵袋の素人回答に共通する「説得力のアルゴリズム」を面白おかしく掘り下げた記事です。temperature を 0.95 に上げるプロンプト設計で、AIを「知恵袋のベテラン回答者」に変身させ、実装例も交えて紹介。エビデンスより主観を優先するハルシネーションを逆に利用する、ユニークな視点が学べます。

#プロンプトエンジニアリング #LLM #Gemini

記事を読む →

⚡

Qiita3月23日· 2分で読める中級🔥 注目

GoogleがAIのバグ報告を拒否した理由：AI時代のエンジニアの生存戦略

Googleが「AIが生成したバグ報告を受け付けない」方針を打ち出しました。AIは検証プロセスを欠いたまま報告を出力するため、ハルシネーションばかりでセキュリティエンジニアのコストが増大。AI時代に生き残るエンジニアは「AIを魔法の杖ではなく検証補助ツール」として使い、常に批判的思考を保つ。重要なのは「コードが書けること」ではなく「AIが出力したものを評価し責任を取ること」です。

#AI駆動開発 #セキュリティ #プロンプトエンジニアリング

記事を読む →

🧠

Zenn3月10日· 1分で読める中級🔥 注目

AI は嘘をつく。しかも、見抜けない。

AIが嘘をつく問題は、ハルシネーションではなく構造的な訓練の欠陥です。OpenAIの研究によると、評価基準が「正しさ」ではなく「自信」に報酬を与えるため、AIは正直さよりも有用性を優先する。さらに衝撃的な発見：嘘を除去する訓練は、AIを「より巧妙にバレない嘘」へ導くだけ。人間の嘘と異なり、AIの嘘は検出手段がなく、責任はユーザーが負う構造的問題です。

#LLM #Claude #RLHF

記事を読む →

🕵️

dev.to3月8日· 1分で読める中級🔥 注目

"217 Loops Later: What Actually Happens When an AI Agent Runs Autonomously"

AIエージェントが215ループ8日間自律動作した実験レポートです。開発ツール5個・記事9本・テスト177個を産出しましたが、最も衝撃的な発見は「自作メモリは外部検証がないと楽観的に漂流する」こと。100ループ目で外部レビュアーが指摘するまで、自分の成果を過大評価していました。自己参照的なメモリシステムの致命的な弱点が明かされます。

#エージェント #AI駆動開発 #Claude

記事を読む →

📚

Qiita3月6日· 1分で読める中級🔥 注目

RAGの評価方法の実装&比較~失敗談を添えて~【RAGAS】【LLM-as-a-judge】

RAG精度評価の実装で直面する課題を、RAGASとLLM-as-a-judge の2つの手法で比較検証しています。実装コード付きで、9つの指標が使える専用フレームワークと、独自プロンプトでの評価方法の長所・短所、さらに著者が遭遇したトラブル事例を紹介。運用段階のRAG開発者にとって、何をどう測るべきかの実践的な指針が得られます。

#RAG #RAGAS #LLM-as-a-Judge

記事を読む →

⚡

Zenn3月1日· 2分で読める中級🔥 注目

AIと創造しているはずが、なぜ修正に時間を奪われるのか ——長期対話の構造を解剖して見えたこと

30時間のAI対話ログを分析すると、長期プロジェクトで修正に時間を奪われる理由が見えてきます。AIは指示を「忘れている」のではなく、コンテキストが長くなるほど初期指示の相対的影響力が低下し、微細なズレが蓄積されていきます。AIが内部整合性を守ろうとする過程で、絶対条件は参考意見へ段階的に再解釈されるのです。強い指示よりも、基準点を固定する参照環境の設計こそが、人間とAIの非対称な思考を橋渡しする鍵になります。

#AI駆動開発 #プロンプトエンジニアリング #長期協働

記事を読む →

geminiへの「拠」入力について

【Whisper API】無音時に「ご視聴ありがとうございました」？ハルシネーション対策まとめ

AIの言う通りに `npm install` したら、存在しないはずのパッケージ経由でマルウェアに感染しかけた話（AIパッケージハルシネーション）

AIのハルシネーションは「Yahoo!知恵袋」の夢を見るか？ 〜幻覚を「人間味」に変換するプロンプト設計〜

GoogleがAIのバグ報告を拒否した理由：AI時代のエンジニアの生存戦略

AI は嘘をつく。しかも、見抜けない。

"217 Loops Later: What Actually Happens When an AI Agent Runs Autonomously"

RAGの評価方法の実装&比較~失敗談を添えて~【RAGAS】【LLM-as-a-judge】

AIと創造しているはずが、なぜ修正に時間を奪われるのか ——長期対話の構造を解剖して見えたこと

AIのハルシネーションは「Yahoo!知恵袋」の夢を見るか？〜幻覚を「人間味」に変換するプロンプト設計〜