LLM News
モデル・基盤AI駆動開発技術・実装エージェントビジネス・活用
📅 今日のまとめ♡☆

LLM News

LLM・VibeCoding・AI駆動開発に関する最新記事をキュレーションしてお届けします。

𝕏RSS

ナビゲーション

  • トップ
  • タグ一覧
  • 検索
  • About
  • プライバシーポリシー

人気タグ

#LLM#Claude#VibeCoding#AI駆動開発#RAG#エージェント#プロンプトエンジニアリング#GPT-4

© 2026 LLM News

← トップへ

#Whisper

4件の記事

関連タグ

#LLM#AI駆動開発#Python#エージェント#個人開発#音声AI#STT#TTS#Ollama#技術・実装
🧠
Qiita4月3日· 1分で読める中級🔥 注目

完全ローカルでずんだもんAIフレンドを作ってみた #1【VOICEVOX × LM Studio × Whisper】

ずんだもんとローカル会話するAIアシスタントを完全ローカル環境で実装した事例です。Whisper・LM Studio・VOICEVOXを組み合わせ、マイク入力をリアルタイムで音声返答するシステムを構築。実装時の課題(音声ブツブツ、CUDAエラー、レイテンシ)と解決策をコード付きで詳細に解説しており、手を動かしながら学べる実践的な内容になっています。

#LLM#AI駆動開発#Whisper
記事を読む →
🧠
Zenn3月25日· 2分で読める中級

音声AIの全体像を整理する(STT / LLM / TTS)

音声AIはSTT→LLM→TTSの3レイヤーで構成されていますが、実装時は全てを使うとは限りません。議事録作成ならSTT+LLMだけで、音声アシスタントなら全層が必要です。Whisper・Ollama・VOICEVOXなど具体的なツールを紹介しつつ、精度・レイテンシ・コストのトレードオフや、カスケード型からEnd-to-End型への進化も解説。プロダクト化時の実装視点も実践的です。

#音声AI#STT#LLM
記事を読む →
🔬
Qiita3月8日· 1分で読める中級

【Python】動画・音声ファイルをAIで文字起こしする方法(無料、MacBook)

OpenAI Whisperを使えば、GeminiやChatGPTの無料版の制限(ファイルサイズ・長さ制限)を回避できます。ffmpegで動画をMP3に変換後、whisperコマンドで文字起こしするだけで、100MB超の大容量ファイルも処理可能です。MacBookでの実装手順が具体的に示されており、すぐに試せる実用性の高い内容です。

#音声処理#Whisper#OpenAI
記事を読む →
🧠
Qiita3月8日· 2分で読める中級🔥 注目

転職活動のポートフォリオで「議事録アプリ」を作っていたら、なぜか東方キャラが戦略を練る軍議システムになった件第1話

議事録の自動化アプリを目指していたプロジェクトが、推し東方キャラによるAIコメント機能の実装で一変しました。faster-whisperとLLM、RAGを組み合わせたリアルタイム文字起こし・要約・リスク監視システムに、プロンプトエンジニアリングで再現した20項目のペルソナ設定が加わります。標準技術で堅牢に、こだわりで楽しく—転職ポートフォリオの試行錯誤から生まれた実務アプリの工夫が学べます。

#LLM#Python#RAG
記事を読む →