EP54 | 零資料訓練的AI新突破!深度剖析可能超車 DeepSeek 的「Absolute Zero Reasoner」論文、「自問自答」實現強化學習 Podcast Por  arte de portada

EP54 | 零資料訓練的AI新突破!深度剖析可能超車 DeepSeek 的「Absolute Zero Reasoner」論文、「自問自答」實現強化學習

EP54 | 零資料訓練的AI新突破!深度剖析可能超車 DeepSeek 的「Absolute Zero Reasoner」論文、「自問自答」實現強化學習

Escúchala gratis

Ver detalles del espectáculo

Acerca de esta escucha

#### 論文 & 文章分享
Absolute Zero: Reinforced Self-play Reasoning with Zero Data : https://arxiv.org/pdf/2505.03335

#### 本期簡介
本集帶你深入解析一篇引發熱議的新論文──《Absolute Zero: Reinforced Self-play Reasoning with Zero Data》。它號稱在「完全零訓練資料」下打造出具備推理能力的大語言模型,究竟是技術奇蹟,還是邁向智能爆炸的起點?我們將以深入淺出的方式,帶你理解 self-play 強化學習的核心邏輯、AZR 在 benchmark 上的亮眼表現,以及潛藏的風險訊號。

#### 節目大綱
00:00 開場與主題引入
01:07 零數據訓練模型的驚人特性
02:01 論文背景與中國AI發展觀察
03:06 強化學習與Self-Play訓練原理
05:01 為何要拋棄人類提供的資料集
06:13 AZR的訓練邏輯與角色設定
08:16 強化學習中的任務設計哲學
10:09 AZR的Proposer與Solver架構
14:00 AZR在Benchmark上的實驗表現
15:54 自主學習的風險與智能爆炸思考

#### 關於主持人
Vincent Chen (www.linkedin.com/in/hsiang-hao-chen-53443593)
數創實驗室創始人, Podcast播客主理人 / 數創智能CEO

美國財星500強電商大廠 | 數據團隊主管
台灣零售行業上市公司 | 資料技術處處長
AI & 大數據跨國經驗10年+ | 跨國反欺詐 | 智能行銷 & 推薦系統
英國全球百大 Data Science & 台灣交大MBA雙碩士

#### 相關連結
LINE社群入群連結 : https://bit.ly/3TU9K0I
數創實驗室官網 : https://datainnolab.ai
聯繫數創實驗室 : vincent.chen@datainnolab.ai

#### 意見回饋
歡迎回饋您希望收聽的AI主題 : https://bit.ly/40Q8PT6

adbl_web_global_use_to_activate_T1_webcro805_stickypopup
Todavía no hay opiniones