- AIクラッチ Newsletter 世界のAI情報を最速で発信
- Posts
- AmazonがAI音声・映像分野で急浮上🎙️🎬|NvidiaはLlama 3.1で最新モデルを打倒!
AmazonがAI音声・映像分野で急浮上🎙️🎬|NvidiaはLlama 3.1で最新モデルを打倒!
Amazonが音声モデル「Nova Sonic」と映像生成モデル「Nova Reel」を発表し、AI競争に本格参戦!OpenAIの音声技術と競合しながらも低コスト&高性能を実現。さらに、NvidiaはMetaのLlama 3.1を活用して最新LLM「DeepSeek R1」を凌駕。Gemini 2.5やMira Muratiの新スタートアップ、UGC風動画のAI作成法も紹介✨【読了時間:4分】でAI業界の最前線をキャッチ!
🗣️ Amazon、OpenAIの音声モードに挑む!
🎥 さらに:AIでUGC(ユーザー生成コンテンツ)風動画を作る方法も紹介!
🕓 読了時間:約4分
昔のものが新しくなる――そんなことをNvidiaが証明しました。MetaのLlama 4の数ヶ月前の前身であるLlama 3.1を使って、DeepSeekのR1を打ち負かすほど強力なモデルを構築したのです。そしてAmazonは、映像と音声のための2つの新モデルを発表しました。
🔍 本日の注目ポイント
Nvidiaの効率的なLLM(大規模言語モデル)
Geminiの現実世界での活用例
Mira Murati(元OpenAI CTO)の新スタートアップ
Amazonの最先端映像・音声モデル公開
AIでUGC風動画を作るチュートリアル
最新AIツール5選🛠️
ニュース・ミーム・SNSのトレンド情報📱
🧠 今日のAI情報

1️⃣ Nvidiaの新モデルがDeepSeek R1を半額で超える性能を発揮!
MetaのLlama 3.1を改良し、高度な推論も可能な高効率モデルを実現。LlamaやAlibabaのQwenを使って、Deep Cogitoという無名スタートアップが最高性能のOSSモデルを生み出したとも報告されています。
2️⃣ Geminiで天気や地図データから現実世界のパターンを解読🔍
Googleは長年、LLMを使って現実データのパターン解析を行ってきましたが、Gemini 2.5はモデル同士の連携を可能にし、気候変動が地域の公衆衛生や経済に与える影響などの複合的な分析もできるように。
3️⃣ 元OpenAI CTO Mira Muratiのスタートアップが急拡大🚀
Thinking Machines LabにOpenAI元研究責任者Bob McGrewなどが参加。現在、20人近い元OpenAIメンバーが在籍しており、すでに10億ドルの資金調達にも成功。ただし、具体的な内容はまだ非公開。
🎬 Amazon、音声・映像分野で反撃開始!
Amazonの新しい映像生成モデル「Nova Reel」は、最大2分間の複数ショット動画を作成可能。キャラクターやスタイルの一貫性も向上しており、開発者向けに公開中(要Bedrockアカウント)。
また、新音声モデル「Nova Sonic」は、OpenAIの最新音声モデルに匹敵しつつ、最大80%安価
GPT-4oよりわずかに低遅延
モゴモゴした発話の認識に強い
会話中に被せて話してこない🗣️
このモデルは既に「Alexa+」にも使われており、開発者が使える段階に! Amazon、いよいよ本気です🔥
🎓 AIでUGC風動画を作るチュートリアル

このラインより上のエリアが無料で表示されます。
続きはこちら→