Zenn

12件の記事

✍️

Zenn4月7日· 1分で読める中級🔥 注目

LLMの性能比較、何件評価すれば足りますか？

LLM性能比較の根拠なき50件評価に統計学から警鐘を鳴らします。β誤り（本当は差があるのに見逃す）を減らす「検出力分析」が必須です。Cohen's d_zを使った効果量の見積もり方と、Pythonでの必要サンプル数計算を実例で解説。d_z=0.3の差なら90件、0.5なら36件必要とするなど、感度高い検定設計ができます。

#プロンプトエンジニアリング #AI駆動開発 #統計学

記事を読む →

✍️

Zenn4月7日· 1分で読める中級🔥 注目

LLMへの丸投げレビューが、たった2ステップで構造化した評価になった

LLMへの壁打ちは同意しすぎる問題を、2段階レビュー法で解決できます。Stage 1で「リスク軸を5つ挙げる」と評価軸を先に生成させ、Stage 2でその軸に基づいて「OK/Warning/Critical」で構造化評価させる。設計レビューでは通常見落としやすいフォールバック設計やエラーマッピングの問題が検出され、肯定バイアスを構造的に排除できました。

#プロンプトエンジニアリング #AI駆動開発 #Claude

記事を読む →

⚡

Zenn4月2日· 1分で読める中級🔥 注目

ChatGPTで提案書を作ったら1時間が15分になった話【営業マン実録】

営業マンが実際に使うChatGPTプロンプトで、提案書作成が100分から15分に短縮できました。商談メモを貼り込んでから構成・課題認識・導入効果・次のアクション別にプロンプトを実行するだけで、週6時間の業務時間を削減。品質の均質化も実現し、顧客固有情報の手入力など注意点を守れば即実用レベルです。

#AI駆動開発 #ChatGPT #業務自動化

記事を読む →

🤖

Zenn4月2日· 2分で読める中級🔥 注目

Zennの記事を3つのAI（Claude・ChatGPT・Gemini）にレビューさせたら、驚くほど傾向が違った

Claude・ChatGPT・Geminiの3つのAIに同じ技術記事をレビューさせると、驚くほど傾向が異なります。ChatGPTは「足し算」で表現のインパクトを重視、Geminiは読者の具体的な疑問を掘り下げ、Claudeは「削る」で構造を尖らせつつコミュニティ文化まで考慮します。実際の採用例も示し、複数モデルの盲点を補い合う実践的なアプローチを提示しています。

#Claude #ChatGPT #Gemini

記事を読む →

⚡

Zenn3月28日· 2分で読める中級🔥 注目

オンプレ運用保守がChatGPTでSREを目指す話：IaC・Kubanetes・AIOpsで運用を再設計する　〜背景とロードマップ〜

オンプレ運用からSREへのキャリア転換を、ChatGPTに設計させたロードマップです。AWS基礎→IaC→Kubernetes→可観測性→CI/CD→AIOpsという7フェーズで、各段階で「なぜそれを学ぶのか」という背景が明確です。REDメソッドでSLO/SLIを設定する思考や、ユーザー影響を起点とした設計など、運用現場の課題から逆算した学習設計が参考になります。

#SRE #AI駆動開発 #AIOps

記事を読む →

⚡

Zenn3月16日· 1分で読める中級🔥 注目

Windows標準環境で始める業務の自動化

Windows標準のPowerShellとAIを組み合わせて業務自動化スクリプトを確実に完成させる手法を紹介しています。設定ファイル設計からコード生成・リファクタリング・検証まで8章で体系化されており、AIの出力を信頼せず「嘘を物理的に封じ込める」プロンプトエンジニアリング戦略が特徴です。外部ツール不要で実践できます。

#AI駆動開発 #プロンプトエンジニアリング #PowerShell

記事を読む →

🧠

Zenn3月2日· 2分で読める中級🔥 注目

5つのAIプラットフォームの検索アーキテクチャを比較する

5つのAIプラットフォーム（Google AI Overviews・ChatGPT・Perplexity・Gemini・Claude）は異なる検索インデックスを参照し、全く異なる回答を返します。同じClaude内でもモデルサイズで推薦内容が変わり、回答の構造そのものが異なります。Perplexityは引用透明性が最高で実際にクリックが発生し、全プラットフォーム共通の最重要施策は高品質で構造化されたコンテンツとschema.org対応です。

#LLM #RAG #検索戦略

記事を読む →

🕵️

Zenn3月2日· 2分で読める中級🔥 注目

Mac MiniでOpen Claw動かしてみた(Codex/ChatGPTサブスクリプション使用)

Open ClawはPC上で自律的にタスク実行するオープンソースのAIエージェントです。この記事は、Mac MiniにOpen Clawをインストールし、ChatGPTサブスクリプション(OAuth認証)経由で動かすまでの手順を詳しく解説します。APIの過度な課金を避けながら、ローカルで24時間自動化を実現する実装ガイドとなっており、手を動かしながら学べる内容です。

#エージェント #AI駆動開発 #Open Claw

記事を読む →

⚡

Zenn3月1日· 2分で読める中級🔥 注目

ソフト未経験が2ヶ月でAI業務ツール14個を稼働させた話【連載まとめ】

半導体エンジニアが2ヶ月でAI業務ツール14個を稼働させた実例が印象的です。コピペ作業→VBA→ChatGPT→Webアプリ→自律AIツールと、技術の進化に従って自分の役割が「作業者」から「設計者」へ変わっていった過程が詳細に記録されています。最大の気づきは、成功に必要なのはコーディング能力ではなく「課題を言語化する力」と「道具を即座に乗り換える身軽さ」という点です。

#AI駆動開発 #業務自動化 #ChatGPT

記事を読む →

✍️

Zenn3月1日· 2分で読める中級🔥 注目

AIへのプロンプトは「要約」してはいけない？——思考を“漂白”せずに投げたら精度が爆上がりした話

AIへの指示は「きれいに要約」するほど精度が落ちる、という逆説的な発見です。タイピングで情報を整理する過程で本質的な「迷い」や「ノイズ」が削られ、AIが行間を読む機会を失うため。音声入力で脳内ダンプをそのまま投げると、誤字脱字も含めた生の思考がAIに届き、一発で正確な回答が返ってくるようになります。実務レベルでチャット往復が激減した実例に基づく、プロンプトエンジニアリングの盲点を指摘しています。

#プロンプトエンジニアリング #AI駆動開発 #ChatGPT

記事を読む →

⚡

Zenn3月1日· 2分で読める中級🔥 注目

AIと創造しているはずが、なぜ修正に時間を奪われるのか ——長期対話の構造を解剖して見えたこと

30時間のAI対話ログを分析すると、長期プロジェクトで修正に時間を奪われる理由が見えてきます。AIは指示を「忘れている」のではなく、コンテキストが長くなるほど初期指示の相対的影響力が低下し、微細なズレが蓄積されていきます。AIが内部整合性を守ろうとする過程で、絶対条件は参考意見へ段階的に再解釈されるのです。強い指示よりも、基準点を固定する参照環境の設計こそが、人間とAIの非対称な思考を橋渡しする鍵になります。

#AI駆動開発 #プロンプトエンジニアリング #長期協働

記事を読む →

🔌

Zenn3月1日· 2分で読める中級🔥 注目

自前のMCP ServerをClaude.ai / ChatGPTのカスタムコネクタとして公開する

Claude.aiとChatGPTのカスタムコネクタ対応で、自前のMCP Serverを認証なしに公開できるようになりました。OAuth 2.1 + PKCEの実装が必須で、Protected Resource MetadataとAuthorization Server Metadataの2つのエンドポイント、Dynamic Client Registrationの実装方法を具体的なJSONスキーマ付きで解説します。EDINET DBでの実装事例から、client_secretのハッシュ化やセッションごとのDCR対応など実装上の判断ポイントも学べます。

#MCP #Claude #ChatGPT

記事を読む →

LLMの性能比較、何件評価すれば足りますか？

LLMへの丸投げレビューが、たった2ステップで構造化した評価になった

ChatGPTで提案書を作ったら1時間が15分になった話【営業マン実録】

Zennの記事を3つのAI（Claude・ChatGPT・Gemini）にレビューさせたら、驚くほど傾向が違った

オンプレ 運用保守がChatGPTでSREを目指す話：IaC・Kubanetes・AIOpsで運用を再設計する 〜背景とロードマップ〜

Windows標準環境で始める業務の自動化

5つのAIプラットフォームの検索アーキテクチャを比較する

Mac MiniでOpen Claw動かしてみた(Codex/ChatGPTサブスクリプション使用)

ソフト未経験が2ヶ月でAI業務ツール14個を稼働させた話【連載まとめ】

AIへのプロンプトは「要約」してはいけない？——思考を“漂白”せずに投げたら精度が爆上がりした話

AIと創造しているはずが、なぜ修正に時間を奪われるのか ——長期対話の構造を解剖して見えたこと

自前のMCP ServerをClaude.ai / ChatGPTのカスタムコネクタとして公開する

オンプレ運用保守がChatGPTでSREを目指す話：IaC・Kubanetes・AIOpsで運用を再設計する　〜背景とロードマップ〜