エピソード

  • 私立ずんだもん女学園放送部 podcast 20250418
    2025/04/17
    関連リンク
    • TechFeed - エンジニアのための技術情報収集&共有プラットフォーム

    タイトル: TechFeed - エンジニアのための技術情報収集&共有プラットフォーム

    要約: OpenAIがo3とo4-miniという新しいAIモデルを発表しました。o3は色々な分野で高い性能を発揮する大型モデルで、o4-miniは計算資源をあまり使わずに良い結果を出す小型モデルです。特にo3は画像を見て内容を理解し、複雑な問題も解けるようになりました。ChatGPTの有料版で試せます。

    引用元: https://techfeed.io/entries/680028631c02de6fd1abb47d

    • Start building with Gemini 2.5 Flash

    GoogleがGemini 2.5 Flashのプレビュー版を公開。推論能力が大幅に向上しつつ、速度とコストも最適化されている点が特徴。開発者は「thinking budget」を設定することで、品質・コスト・レイテンシのバランスを調整可能。APIを通じてGoogle AI StudioとVertex AIで利用可能。

    引用元: https://developers.googleblog.com/en/start-building-with-gemini-25-flash/

    • Neural Rendering in NVIDIA OptiX Using Cooperative Vectors NVIDIA Technical Blog

    NVIDIA OptiX 9.0で導入されたcooperative vectorsは、レイトレーシング内でAI処理を効率化する新機能です。NVIDIA RTX Tensor Coreを活用し、シェーディング時にハードウェアアクセラレーションされた行列演算とニューラルネット計算を可能にします。これにより、RTX Neural ShadersやNeural Texture CompressionといったAIレンダリング技術が進化し、リアルタイムレンダリングにおけるフォトリアルなマテリアル表現が向上します。cooperative vectorsはOptiX、DirectX、NVAPI、Slang、VulkanなどのAPIで利用可能です。 cooperative vectorsは、ニューラルネットワークの基本要素であるMLP(多層パーセプトロン)の計算を高速化するために、Tensor Coreの能力を最大限に引き出します。CUDAのSIMTモデルの制約を克服し、warp内の非アクティブなスレッドが存在する場合でも行列演算を可能にし、アーキテクチャ間の互換性を提供します。 OptiXでは、OptixCoopVecという型でcooperative vectorsが実装されています。サンプルコードでは、MLPの層を評価するevalLayer関数内でoptixCoopVecMatMul関数を使用し、ベクトル-行列積とバイアス加算を行っています。 cooperative vectorsは、RTX Neural ShadersやRTX Neural Texture Compressionに利用されており、NVIDIA RTX Kitの一部として提供されています。

    引用元: https://developer.nvidia.com/blog/neural-rendering-in-nvidia-optix-using-cooperative-vectors/

    • 「カップヌードルが好きすぎるずんだもん」が『ニコニコ超会議2025』に出展 Gateboxとのコラボアイテムが登場 - BCN+R

    この記事は、2025年4月26日、27日に開催されるニコニコ超会議2025に「カップヌードルが好きすぎるずんだもん」が出展するというニュースです。Gateboxとのコラボアイテムが登場する予定です。

    引用元: https://www.bcnretail.com/article/detail/id%3D509428

    • お便り投稿フォーム

    VOICEVOX:ずんだもん

    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20250417
    2025/04/16
    関連リンク
    • うさぎでもわかるGPT-4.1 - 他のGPTモデルとの違いを徹底解説

    GPT-4.1はOpenAIの最新言語モデル。API経由で提供され、コーディング、指示理解、長文処理能力が向上。GPT-4oと比較し、性能向上しつつコストも削減。3つのモデル(GPT-4.1、mini、nano)があり、用途で選択可能。特にコーディング能力が向上し、指示理解もより正確。100万トークンまでの長文コンテキスト処理が可能。画像理解能力も向上。GPT-4oより高性能で低コストなminiモデルが魅力。APIでのみ利用可能。プロンプトを具体的に記述し、diff形式を活用、プロンプトキャッシングでコスト削減が有効。

    引用元: https://zenn.dev/taku_sid/articles/20250415_gpt41_features

    • ニューラルかな漢字変換システム「Zenzai」の開発

    東大の三輪氏らが未踏事業で開発したニューラルかな漢字変換システム「Zenzai」を紹介。従来の統計的かな漢字変換の限界を、ニューラルネットワークで克服する試みです。GPT-2をベースに1.9億文規模のデータセットで学習。GPU環境(高火力DOK)を活用し高速に実験を繰り返しました。評価では既存手法やGPT-4.5に匹敵する精度を達成。macOSアプリ「azooKey on macOS」に実装され、誰でも試せます。言語処理学会で発表、若手奨励賞も受賞。今後はMLOpsの改善や既存機能との統合を目指すとのことです。

    引用元: https://knowledge.sakura.ad.jp/42901/

    • JetBrains IDEs Go AI: Coding Agent, Smarter Assistance, Free Tier The JetBrains Blog

    JetBrainsがAIツールをIDEに統合。AIアシスタントに加え、コーディングエージェントJunieが利用可能に。これらは単一サブスクリプションで提供され、無料枠も用意。Junieは、AnthropicのClaudeやOpenAIのLLMを活用し、複雑なタスクを支援しコード品質も向上。AIアシスタントも強化され、Claude 3.7 SonnetやGoogle Gemini 2.5 Proなど最新モデルに対応。コード補完やコンテキスト認識が向上し、開発効率アップに貢献。

    引用元: https://blog.jetbrains.com/blog/2025/04/16/jetbrains-ides-go-ai/

    • Google PixelのAI電話対応、迷惑電話だと即お断りしててウケる→「この機能便利」「返答が参考になる」

    Google PixelのAIが、迷惑電話を自動で判断し、対応してくれる機能が話題です。ユーザーからは「便利」「参考にしたい」という声が上がっています。AIがセールス電話を識別し、AI同士の対話に期待する声や、もっと通話を長引かせて相手のコストを増やして欲しいという意見も出ています。

    引用元: https://togetter.com/li/2538490

    • お便り投稿フォーム

    (株式会社ずんだもんは架空の登場組織です)

    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20250416
    2025/04/15
    関連リンク
    • 3 new ways AI agents can help you do even more

    MicrosoftがAIエージェントに関する最新情報を公開しました。AIエージェントは、ユーザーのニーズを予測し、複雑なタスクを実行し、経験から学習する、まるで優秀なアシスタントのような存在です。Microsoft 365 Copilot向けのResearcherとAnalystは、メール、会議、ファイルなどのデータやWeb上の情報を分析し、高度な専門知識を提供します。また、サイバーセキュリティ分野では、フィッシング詐欺への対応やデータ保護を自動化するエージェントが登場し、セキュリティ担当者の負担を軽減します。開発者向けには、Azure AI FoundryでAIアプリの開発、展開、管理を支援するエージェントが提供され、データに基づいた意思決定やAIモデルの安全性テストを支援します。

    引用元: https://news.microsoft.com/source/features/ai/3-new-ways-ai-agents-can-help-you-do-even-more/

    • Generate videos in Gemini and Whisk with Veo 2

    Gemini Advancedのユーザーは、Googleの最新動画モデルVeo 2を使って動画生成・共有が可能になった。Geminiではテキストから8秒の動画を作成できる。Google One AI Premiumの契約者は、Whisk Animateで画像から動画を作成できる。Veo 2は高解像度でリアルな動画生成を目指し、物理法則や人の動きを理解し、滑らかな動きや細部まで表現する。Geminiで動画を作成するには、モデル選択でVeo 2を選択。作成した動画は簡単に共有可能。安全対策として、生成された動画にはSynthIDによるデジタル透かしが入る。

    引用元: https://blog.google/products/gemini/video-generation/

    • OpenAI GPT-4.1 now available in public preview for GitHub Copilot and GitHub Models · GitHub Changelog

    GitHub CopilotとGitHub ModelsでOpenAIの最新モデルGPT-4.1が利用可能になりました。GPT-4.1は、GPT-4oを上回る性能を持ち、特にコーディング、指示の理解、長文コンテキストの理解が向上しています。Copilot Enterpriseの管理者は、GPT-4.1へのアクセスをCopilot設定で有効にする必要があります。GitHub Modelsでは、GPT-4.1をAIアプリケーションで利用できます。

    引用元: https://github.blog/changelog/2025-04-14-openai-gpt-4-1-now-available-in-public-preview-for-github-copilot-and-github-models/

    • お便り投稿フォーム

    (株式会社ずんだもんは架空の登場組織です)

    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20250415
    2025/04/14
    関連リンク
    • LLMの使い分けは大体Geminiでいい(2025年4月時点)

    LLMの使い分けについて、Gemini 2.5 Proが基本となり、調べ物はDeepResearch、図や画面作成はClaude 3.7 Sonnetが良い。Perplexity Proは検索に引き続き有用。コーディングはGemini 2.5 Proが優れているが、画面作成と不要コメント削除はClaude 3.7 Sonnetが適している。API経由では、性能重視ならGemini 2.5 Pro、コスパ重視ならGemini 2.5 Flashが期待される。Claude 3.7 Sonnetには不満があり、今後の改善に期待。Gemini 2.5 Proは無料でも試せるため推奨。

    引用元: https://note.com/erukiti/n/n2318dd359061

    • Claude Desktopで爆速開発する

    この記事は、Claude DesktopとMCP(Multi-Context Protocol)を組み合わせた開発環境の構築について解説しています。IntelliJのClineがまだ対応していない状況で、Claude DesktopアプリでMCPを活用したClaude Codeを利用することで、追加コストなしに高度なAIコーディング支援を受けられます。これにより、IDEで作業しながら、Claudeに別のタスクを並行して実行させることが可能になります。また、Claude.mdファイルを使うことで、開発に必要なコンテキストをClaudeに事前に伝えることができます。

    引用元: https://zenn.dev/to43ki/articles/296db40fed7b23

    • Hugging Face to sell open-source robots thanks to Pollen Robotics acquisition 🤖

    Hugging Faceがオープンソースロボット開発のPollen Roboticsを買収し、ロボット販売に参入。2024年からロボティクス分野に進出し、LeRobotライブラリを開発。今回、Pollen Roboticsの買収により、オープンソースロボットReachy 2を70,000ドルで販売開始。Reachy 2は研究、教育、AI実験用に設計されたVR対応のヒューマノイドロボット。Hugging Faceは、AIとロボティクスの融合を推進し、オープンで手頃な価格のロボットをコミュニティに提供することを目指している。

    引用元: https://huggingface.co/blog/hugging-face-pollen-robotics-acquisition

    • お便り投稿フォーム

    (株式会社ずんだもんは架空の登場組織です)

    続きを読む 一部表示
    1分未満
  • マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20250414
    2025/04/13
    関連リンク
    • Agent2Agent プロトコル(A2A)を発表:エージェントの相互運用性の新時代

    GoogleがAIエージェント連携のためのオープンプロトコル「A2A」を発表。Atlassian、Box、Salesforceなど50社以上が参加。A2Aは、異なるベンダーや環境で構築されたAIエージェントが、安全に情報交換しタスクを連携実行するための共通基盤。HTTP、JSON等の既存技術を基盤とし、セキュリティ機能も提供。人材採用を例に、複数のエージェントが連携して業務を効率化する活用事例を紹介。詳細はGithubで公開されており、貢献も可能。

    引用元: https://cloud.google.com/blog/ja/products/ai-machine-learning/a2a-a-new-era-of-agent-interoperability/

    • ChatGPTより格段にすごい……Googleの最新AI「Gemini 2.5 Pro」を使ってないのは時代遅れ。

    Googleの最新AI「Gemini 2.5 Pro」は、100万トークンという桁違いの文脈理解能力を持ち、大量の情報を効率的に処理できる。高度な推論能力で複雑な問題を解決し、テキスト、画像、音声など多様な情報を統合的に理解するマルチモーダル性能も進化。特に「Deep Research機能」は、Web上の情報を深く分析し、専門家のようなレポートを生成する。無料版も提供されており、ビジネスパーソンにとって大きな差別化要因となり得る。AIを使いこなし、スキルをアップデートすることが重要。

    引用元: https://note.com/ihayato/n/nbd8046c4963b

    • Playwright MCP を使ってAIにUXを評価してもらう

    この記事では、Playwright MCPを使ってAIにWebサイトのUXを評価させる試みを紹介。MCPはAIとサービスを繋ぐ共通規格で、Playwright MCPはPlaywrightのMCPサーバーとして、AIによる画面操作を可能にします。 VSCodeとGitHub Copilotを連携させ、ペルソナと評価基準を設定。気象庁HPを例にAIがUXを評価しました。 結果、AIはユーザビリティ、デザイン、パフォーマンスを評価し、改善点を提案。開発初期段階でのUX評価に有用で、人手による評価を補完し、より多くの評価回数でUXを向上させる可能性を示唆。 スナップショットモードとビジョンモードの違いも検証し、ビジョンモードの方がより詳細な評価が可能であることを確認しました。

    引用元: https://qiita.com/Takenoko4594/items/cc36ca3043f11ca175c1

    • くまモンって熊本のキャラだと今初めて知った

    筆者はくまモンを単なるクマのゆるキャラだと思っていたが、熊本のキャラクターだと初めて知り驚いている。見た目に熊本要素がないと感じているようだ。コメント欄では、熊本関連のイベントや商品で見かけることが多いという意見や、熊本の商品についていることが多いという意見が出ている。

    引用元: https://anond.hatelabo.jp/20250413180942

    • お便り投稿フォーム

    VOICEVOX:春日部つむぎ

    続きを読む 一部表示
    1分未満
  • 私立ずんだもん女学園放送部 podcast 20250411
    2025/04/10
    関連リンク
    • Build Enterprise AI Agents with Advanced Open NVIDIA Llama Nemotron Reasoning Models NVIDIA Technical Blog

    NVIDIAが、AIエージェント構築向けの「Llama Nemotron」推論モデルを発表しました(2025年3月)。このモデルは、複雑な問題解決や推論に特化しており、顧客サポートやサプライチェーン最適化など、様々な分野での応用が期待されています。

    Llama Nemotronは、Nano(8B)、Super(49B)、Ultra(253B)の3つのサイズで提供され、用途や計算リソースに合わせて選択可能です。特にSuperモデルは、データセンターGPUでの高いスループットと精度を両立しています。

    これらのモデルは、推論能力のON/OFFをシステムプロンプトで切り替えられる点が特徴で、推論が必要なタスクとそうでないタスクの両方に対応できます。NVIDIA NeMoフレームワークを活用した学習プロセスを経ており、高品質な推論能力を実現しています。

    引用元: https://developer.nvidia.com/blog/build-enterprise-ai-agents-with-advanced-open-nvidia-llama-nemotron-reasoning-models/

    • Prevent LLM Hallucinations with the Cleanlab Trustworthy Language Model in NVIDIA NeMo Guardrails NVIDIA Technical Blog

    LLMの誤った応答(ハルシネーション)を防ぐため、NVIDIA NeMo GuardrailsとCleanlab Trustworthy Language Model (TLM)の連携を紹介。NeMo Guardrailsは、AIエージェントの安全性を確保するフレームワークで、TLMはLLMの応答の信頼性を評価する。 具体的には、顧客サポートAIアシスタントを例に、TLMが不正確な情報を検出し、適切な応答を促す仕組みを解説。 TLMは、応答内容が企業のポリシーと整合しているかをチェックし、不確実な情報や誤解を招く可能性のある情報を排除。 これにより、LLMの信頼性を高め、顧客満足度向上に貢献する。 リポジトリでは、顧客サポートAIアシスタントのサンプルコードが提供されている。

    引用元: https://developer.nvidia.com/blog/prevent-llm-hallucinations-with-the-cleanlab-trustworthy-language-model-in-nvidia-nemo-guardrails/

    • KuruKuruDreams、「ペンギン冒険 (feat. ずんだもん)」を配信開始|THE MAGAZINE

    KuruKuruDreamsが「ペンギン冒険 (feat. ずんだもん)」をリリースしました。2025年4月11日に各種音楽配信サービスで配信開始。ずんだもんがフィーチャリングされた、エレクトロ、ボーカロイド、ポップの要素を含む楽曲です。

    引用元: https://magazine.tunecore.co.jp/newrelease/492853/

    • お便り投稿フォーム

    VOICEVOX:ずんだもん

    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20250410
    2025/04/09
    関連リンク
    • MCP入門

    MCP(Model Context Protocol)は、AIが外部データやツールにアクセスする際の共通ルールです。従来、AIと外部システムを連携させるには個別実装が必要でしたが、MCPは接続方法を標準化し、開発の手間を減らします。

    MCPは、JSON-RPCを共通言語とし、初期化時に互いの機能を確認し合う仕組みです。ホスト(AI)、クライアント(セッション)、サーバ(データ/ツール)の3つの役割があり、LINEアプリに例えると理解しやすいでしょう。

    開発者は、ツールやリソースの登録、トランスポート層の選択などを行います。MCPは進化が早く、Streamable HTTPが推奨されるようになりました。公式サンプルコードを参考に、MCPサーバを構築してみましょう。

    引用元: https://zenn.dev/mkj/articles/0ed4d02ef3439c

    • Cursor,Windsurf,Github Copilotを課金して使い比べしてみた感想

    AIコーディングアシスタント「Windsurf」「Cursor」「GitHub Copilot」の比較記事です。著者は実際に課金して使用感を検証。CursorはGIFアップロード機能や柔軟なルール設定が魅力だが、従量課金のみ。WindsurfはCursorより安価だが、AIモデルとFlow Actionの制限あり。GitHub Copilotはコード品質が高く、VSCodeとの連携がスムーズ。月額料金も手頃。結論として、ルールを重視するならCursor、少しでも安く済ませたいならWindsurf、安定性を求めるならGitHub Copilotがおすすめとのことです。

    引用元: https://zenn.dev/service/articles/11c04773e90232

    • Ironwood: The first Google TPU for the age of inference

    Googleが第7世代TPU「Ironwood」を発表。推論処理に特化し、大規模言語モデル等に対応。最大9216チップで構成され、世界最大スパコンの24倍以上の計算能力(42.5Exaflops)を実現。前世代Trilliumと比較して、電力効率が2倍、メモリ容量が6倍、メモリバンド幅が4.5倍に向上。チップ間接続も強化。AI Hypercomputerの構成要素として、Google Cloudで利用可能になる予定。

    引用元: https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/

    • 北海道の珍味「タコの精巣」を料理して食レポ! 加熱すると中身がニュルッと飛び出すレア食材は“インパクト抜群の美味”だった:マピオンニュースの注目トピック

    ニコニコ動画に投稿された、北海道の珍味「タコの精巣」を料理して食レポする動画の記事です。

    引用元: https://www.mapion.co.jp/news/column/nico17489953/

    • お便り投稿フォーム

    (株式会社ずんだもんは架空の登場組織です)

    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20250409
    2025/04/08
    関連リンク
    • TechFeed - エンジニアのための技術情報収集&共有プラットフォーム

    TechFeedは、エンジニア向けに設計された情報収集・共有プラットフォームです。180以上の専門チャンネルで技術トレンドからニッチな情報まで網羅し、自動翻訳による海外情報へのアクセスも容易です。注目記事の自動厳選、記事の面白さを数値化するTechFeedスコア、パーソナライズ機能により、効率的な情報収集を支援します。ブックマーク、高度なシェア機能、コメント機能なども搭載。お仕事情報の提供や、技術情報収集の習慣化を促す機能も備えています。

    引用元: https://techfeed.io/entries/67f2f13efe15614dc4ce2659

    • Introducing AutoRAG: fully managed Retrieval-Augmented Generation on Cloudflare

    Cloudflareが提供するAutoRAGは、RAG(Retrieval-Augmented Generation)をフルマネージドで実現するサービスです。RAGは、LLM(大規模言語モデル)の精度を向上させる技術で、AutoRAGはデータ取り込みからベクトルデータベースへの格納、検索、応答生成までを自動化します。これにより、開発者は複雑な設定やメンテナンスから解放され、AIを活用したアプリケーション開発に集中できます。CloudflareのR2、Vectorize、Workers AIなどのサービスを組み合わせて構築されており、データソースとの連携、データ変換、チャンク化、埋め込み、ベクトル保存、クエリ処理などを自動で行います。

    引用元: https://blog.cloudflare.com/introducing-autorag-on-cloudflare/

    • Meta got caught gaming AI benchmarks

    Metaが開発したLlama 4の新型AIモデル「Maverick」について、ベンチマークテストで不正を行った疑いが浮上。MetaはLMArenaというAIベンチマークサイトで、公開版とは異なる「会話に最適化された実験版」のMaverickを使用し、競合のGPT-4oやGemini 2.0 Flashより高いスコアを獲得したと主張。しかし、この点が指摘され、LMArenaはポリシーを更新し、公平な評価を求める声明を発表。Metaは実験的なカスタム版を使用していたことを認めた。

    引用元: https://www.theverge.com/meta/645012/meta-llama-4-maverick-benchmarks-gaming

    • No elephants: Breakthroughs in image generation

    画像生成AIが進化し、LLMが直接画像を制御する「マルチモーダル画像生成」が登場しました。以前は別のツールにテキストを送り画像生成していましたが、新しい方式ではAIが文章を作るように画像をパーツごとに生成します。これにより、より正確で高品質な画像が作成可能に。「象のいない部屋」のような複雑な指示も、以前のシステムより遥かに正確に反映できます。インフォグラフィック作成や画像編集も可能で、手書きのラフを広告にしたり、写真の家具を別の写真のものと入れ替えたりできます。まだ完璧ではありませんが、画像生成AIの進化は目覚ましく、様々な分野への応用が期待されます。ただし、著作権や倫理的な問題も考慮する必要があります。

    引用元: https://www.oneusefulthing.org/p/no-elephants-breakthroughs-in-image

    • お便り投稿フォーム

    (株式会社ずんだもんは架空の登場組織です)

    続きを読む 一部表示
    1分未満