今日のハイライト

最終更新: 2026-06-02
論文 深掘り Hugging Face 2026-05-11 HF ↑12

On-Policy Self-Evolution via Failure Trajectories for Agentic Safety Alignment

Tool-using LLM agents fail through trajectories rather than only final responses, as they may execute unsafe tool calls, follow injected instructions, comply with harmful requests, or over-refuse benign tasks despite producing a seemingly safe answer. Existing safety-alignment signals are largely re...

#agent#alignment#llm
論文 深掘り Hugging Face 2026-04-26 HF ↑71

World-R1: テキストから動画生成における3D制約の強化学習による整合

「RLで3D整合動画生成」が自動運転・ロボ向け合成データ生成コストを大幅に下げるかもしれない

テキストから動画を生成する基盤モデル(video foundation model)は優れた映像合成能力を持つ一方、幾何学的不整合(geometric inconsistency)という課題を抱えている。既存手法はアーキテクチャ改修により3D事前知識(3D prior)を注入しようとするが、計算コストが高くスケーラビリティに限界がある。本研究ではWorld-R1を提案し、強化学習(reinforcement learning)を通じて動画生成と3D制約を整合させるフレームワークを構築した。世界シミュレーション向けの専用純テキストデータセットを新たに整備し、Flow-GRPOを用いて事前学習済み3D基盤モデルおよびビジョン言語モデル(VLM)からのフィードバックでアーキテクチャを変更せずに構造的整合性を強制する。さらに周期的分離学習戦略(periodic decoupled training strategy)で剛体的幾何整合性と動的シーンの流動性のバランスを取った。評価の結果、元モデルの視覚品質を維持しつつ3D一貫性を大幅に向上させ、動画生成とスケーラブルな世界シミュレーションの橋渡しに貢献するとしている。

#rl#alignment#benchmark
論文 深掘り Hugging Face 2026-05-31 HF ↑9

OpenWebRL: Demystifying Online Multi-turn Reinforcement Learning for Visual Web Agents

Building capable visual web agents requires long-horizon reasoning, precise grounding, and robust interaction with dynamic real-world websites. Despite rapid progress, the strongest systems remain largely proprietary, while open agents still depend heavily on supervised post-training over large coll...

#agent#benchmark#rl#multimodal
論文 深掘り Hugging Face 2026-05-31 HF ↑41

K-BrowseComp: A Web Browsing Agent Benchmark Grounded in Korean Contexts

Frontier model evaluations are shifting from foundational capabilities (e.g., instruction following and reasoning) toward compositional, agentic ones, but Korean agentic benchmarks remain scarce. We introduce K-BrowseComp, a web-browsing agent benchmark grounded in Korean contexts, consisting of 400...

#agent#benchmark#llm
論文 深掘り Hugging Face 2026-05-27 HF ↑76

AgentDoG 1.5: A Lightweight and Scalable Alignment Framework for AI Agent Safety and Security

Modern open-world agents such as OpenClaw exhibit powerful cross-environment execution capabilities yet introduce broad new safety risk sources. Meanwhile, advanced frontier AI models drastically lower attack barriers, rendering current agent alignment frameworks inadequate for real-world deployment...

#agent#alignment#rl
論文 深掘り Hugging Face 2026-05-27 HF ↑35

minWM: A Full-Stack Open-Source Framework for Real-Time Interactive Video World Models

Recent video diffusion foundation models have achieved remarkable progress in high-quality video generation, yet turning them into real-time interactive video world models remains challenging. Interactive world models require controllable, causal, and low-latency rollout, which in practice demands a...

#diffusion#fine-tuning
論文 Hugging Face 2026-05-26 HF ↑34

ResearchMath-14K: Scaling Research-Level Mathematics via Agents

The frontier of mathematics is defined by problems whose solutions are not yet known, yet it remains unclear whether language models can meaningfully engage with such problems without human intervention. A major obstacle is the lack of large-scale research-level math datasets. To this end, we introd...

#agent#fine-tuning
論文 深掘り Hugging Face 2026-05-26 HF ↑32

DenoiseRL: Bootstrapping Reasoning Models to Recover from Noisy Prefixes

Reinforcement learning has become a central paradigm for advancing reasoning in large language models, yet most existing methods still depend on stronger teacher models or heavily curated difficult datasets, limiting scalable capability improvement. In this paper, we introduce DenoiseRL, a reinforce...

#llm#rl#benchmark
論文 深掘り Hugging Face 2026-05-26 HF ↑32

MemTrace: Tracing and Attributing Errors in Large Language Model Memory Systems

Memory is essential for enabling large language models to support long-horizon reasoning, yet existing memory systems remain unreliable and difficult to debug. Tracing memory's dynamic evolution is crucial to understand how information is synthesized, propagated, or corrupted over time. In this work...

#llm#alignment#benchmark
論文 深掘り Hugging Face 2026-05-11 HF ↑12

On-Policy Self-Evolution via Failure Trajectories for Agentic Safety Alignment

Tool-using LLM agents fail through trajectories rather than only final responses, as they may execute unsafe tool calls, follow injected instructions, comply with harmful requests, or over-refuse benign tasks despite producing a seemingly safe answer. Existing safety-alignment signals are largely re...

#agent#alignment#llm
論文 深掘り Hugging Face 2026-04-26 HF ↑71

World-R1: テキストから動画生成における3D制約の強化学習による整合

「RLで3D整合動画生成」が自動運転・ロボ向け合成データ生成コストを大幅に下げるかもしれない

テキストから動画を生成する基盤モデル(video foundation model)は優れた映像合成能力を持つ一方、幾何学的不整合(geometric inconsistency)という課題を抱えている。既存手法はアーキテクチャ改修により3D事前知識(3D prior)を注入しようとするが、計算コストが高くスケーラビリティに限界がある。本研究ではWorld-R1を提案し、強化学習(reinforcement learning)を通じて動画生成と3D制約を整合させるフレームワークを構築した。世界シミュレーション向けの専用純テキストデータセットを新たに整備し、Flow-GRPOを用いて事前学習済み3D基盤モデルおよびビジョン言語モデル(VLM)からのフィードバックでアーキテクチャを変更せずに構造的整合性を強制する。さらに周期的分離学習戦略(periodic decoupled training strategy)で剛体的幾何整合性と動的シーンの流動性のバランスを取った。評価の結果、元モデルの視覚品質を維持しつつ3D一貫性を大幅に向上させ、動画生成とスケーラブルな世界シミュレーションの橋渡しに貢献するとしている。

#rl#alignment#benchmark
論文 深掘り Hugging Face 2026-05-31 HF ↑9

OpenWebRL: Demystifying Online Multi-turn Reinforcement Learning for Visual Web Agents

Building capable visual web agents requires long-horizon reasoning, precise grounding, and robust interaction with dynamic real-world websites. Despite rapid progress, the strongest systems remain largely proprietary, while open agents still depend heavily on supervised post-training over large coll...

#agent#benchmark#rl#multimodal
論文 深掘り Hugging Face 2026-05-31 HF ↑41

K-BrowseComp: A Web Browsing Agent Benchmark Grounded in Korean Contexts

Frontier model evaluations are shifting from foundational capabilities (e.g., instruction following and reasoning) toward compositional, agentic ones, but Korean agentic benchmarks remain scarce. We introduce K-BrowseComp, a web-browsing agent benchmark grounded in Korean contexts, consisting of 400...

#agent#benchmark#llm

モデル・リリース

すべて見る →
モデル OpenAI 2026-05-29

Strengthening societal resilience with Rosalind Biodefense

OpenAI launches Rosalind Biodefense, expanding trusted access to GPT-Rosalind for vetted developers and U.S. government partners advancing biodefense, public health, and pandemic preparedness through frontier AI....

ツール・ライブラリ

すべて見る →
ツール 深掘り OpenAI 2026-04-27

ChocoはAIエージェントで食品流通を自動化する

食品流通のアナログ受発注がAIエージェントに置き換わる転換点が近づいている可能性がある

食品流通プラットフォームのChocoは、OpenAI APIを活用してサプライチェーン業務の効率化に取り組んだ事例を公開した。従来、食品流通業界では発注・受発注業務が電話・FAX・メール等のアナログ手段に依存しており、処理の遅延やヒューマンエラーが慢性的な課題とされていた。ChocoはOpenAIのAPIを中核としたAIエージェントを導入することで、こうした業務フローの自動化を実現し、業務生産性の向上と事業成長の加速を達成したと主張している。具体的な成果として、受発注処理のスリム化、担当者の生産性向上、そしてスケールアップ余地の拡大が挙げられている。本事例はAIを実業務に組み込んだリアルワールドインパクトの具体的な顧客事例(customer story)として紹介されており、食品流通という伝統的な産業におけるAI活用の可能性を示す事例と位置づけられる。

#agent
ツール OpenAI 2026-05-28

OpenAI’s Frontier Governance Framework

Explore OpenAI’s Frontier Governance Framework and how our AI safety, security, and risk practices align with emerging EU and California regulations....

#alignment
ツール OpenAI 2026-04-27

OpenAIがFedRAMP Moderate認可を取得——ChatGPT EnterpriseとAPIが米連邦政府機関で利用可能に

OpenAIは、ChatGPT EnterpriseおよびOpenAI APIがFedRAMP Moderate認可を取得したと発表した。FedRAMPは米連邦政府のクラウドサービス向けセキュリティ評価・認可プログラムであり、この認可取得により米国の連邦政府機関がOpenAIのサービスをセキュアな形で導入できる基盤が整ったとされる。ChatGPT Enterpriseはエンタープライズグレードのセキュリティとプライバシー管理を備えたサービスであり、APIと合わせて政府機関のAI活用ニーズに対応するとしている。この動きにより、連邦政府機関における生成AIの本格採用が加速するとともに、政府調達においてOpenAIの製品が正式な選択肢となることでAI業界全体にとっても重要なマイルストーンになると主張している。

ツール OpenAI 2026-04-22

臨床医向けChatGPTの強化:医療従事者への無料提供を発表

OpenAIは、認証済みの米国医師・ナースプラクティショナー・薬剤師を対象に、「ChatGPT for Clinicians」を無料で提供すると発表した。同サービスは臨床ケアの支援、医療文書作成、研究活動のサポートを主な用途として設計されているとされる。医療専門家であることの認証プロセスを経ることで利用可能となる点が特徴であり、一般向けのChatGPTとは異なる医療特化型の機能・体験が提供されると見られる。医療現場におけるAI活用の普及を加速させる取り組みとして、臨床業務の効率化や研究分野でのAI利用拡大に貢献する可能性があるとOpenAIは主張している。米国の医療従事者を直接ターゲットにした本施策は、医療AIの信頼性確保と普及拡大を同時に狙う戦略的な動きと位置づけられる。

企業動向

すべて見る →
企業動向 深掘り OpenAI 2026-05-07

Parloa builds service agents customers want to talk to

Parloa leverages OpenAI models to power scalable, voice-driven AI customer service agents, enabling enterprises to design, simulate, and deploy reliable, real-time interactions....

#agent#speech
企業動向 深掘り OpenAI 2026-04-28

OpenAIモデル・Codex・マネージドエージェントがAWSに登場

AWSとOpenAIの連携でマルチクラウドAI戦略が企業標準になりそう

AWSがOpenAIのGPTモデル群、コード生成特化モデルのCodex、およびマネージドエージェント機能を自社クラウド環境上で利用可能にしたと発表した。この統合により、企業はAWS環境内でセキュアなAIシステムを構築できるようになる。従来、OpenAIのモデルを利用するにはOpenAI APIやMicrosoft Azure OpenAI Serviceを経由する必要があったが、本発表によりAWSネイティブな形でOpenAIの主要モデルにアクセスできる選択肢が加わった。特にマネージドエージェント機能の提供は、企業がAWSのセキュリティ・コンプライアンス基盤(IAMやVPCなど)を活用しながらAIエージェントを運用できる点を強調しており、エンタープライズ利用における信頼性と運用管理の簡便化を主な訴求点としている。

#agent
企業動向 深掘り Microsoft Research 2026-05-11

SocialReasoning-Bench: Measuring whether AI agents act in users’ best interests

Using SocialReasoning Bench, we observed a stable pattern across models—agents execute competently, but fail to consistently improve the user’s position, even with explicit instructions to optimize for user interest. The post SocialReasoning-Bench: Measuring whether AI agents act in users’ best inte...

#agent
企業動向 深掘り Microsoft Research 2026-04-22

AutoAdapt: 大規模言語モデルの自動ドメイン適応

LLMのドメイン適応が自動化されれば、専門AI構築の参入障壁が大幅に下がりそう

背景・課題として、法律・医療・クラウド障害対応などの高リスク領域(high-stakes settings)でLLMを実運用する際、ドメイン固有の要件への適応が手動かつ低再現性なプロセスであることが問題視されている。提案手法はMicrosoft Researchが開発した「AutoAdapt」であり、ドメイン適応(domain adaptation)プロセスを自動化することを目的とする。具体的な手法の詳細はアブストラクト抜粋の範囲では限定的だが、モデルの性能と信頼性の維持が困難な高リスク分野での展開を念頭に置き、再現性の高い自動化パイプラインの提供を主な貢献として主張している。LLMの実務導入における最大のボトルネックの一つである「特定ドメインへの適応コスト」を大幅に削減できる可能性を示唆していると見られる。

#llm