
; 刘壮: 对于数字化工作,比如白领工作,我认为不需要视觉世界模型。 很多事情都在数字空间里运作,我最多需要模型能读取我的电脑屏幕,而屏幕内容可以被数字化或压缩,通常最多是一组图像,不是实时视频流,这相对容易。 &nb
; 根本原因还是视觉数据的吞吐量太高,我们还没有足够的算力来完美地对它建模。 Ravid:那你觉得我们真的需要世界模型来解决 99% 的任务吗? 刘壮: 对于数字化工作,比如白领工作,我认为不需
当前文章:http://gl5.ruoqiaobo.cn/p2prmc/tir.html
发布时间:11:32:39
推荐阅读