欢迎进入中国休闲研究网站

Welcome to the Website of Chinese Leisure Studies

阅读与点评(二)

2025年1月25-2025年2月25日

抽验方法说明:抽检式、随机性、参考同类型、尊重科学精神、尊重知识版权

评价标准:选题新颖、文理兼备、知识性与趣味性、启蒙启发与启智、语言通俗易懂、思想与方法、原创性、跨学科性等。

1)机器人大升级?像人类一样推理,“拿捏”任意家庭用品! 上传时间:2025-2-24 学术头条 AI 机器人 推理(点评:本文介绍了Figure AI 发布的首个通用视觉-语言-行动(VLA)模型——Helix,这项技术的研发特色是让AI能像人类一样推理,将感知、语言理解和学习控制融为一体,并通过自然语言直接控制人形机器人整个上半身。在 Helix 中,新技能可以用语言即时指定。在这项研究中,Helix 展现出了训练效率高且仅需要单一权重集的特点。这种收集规模与现代的单任务模仿学习数据集更相近。尽管对数据的要求相对较低,但 Helix 仍能扩展到更具挑战性的上半身人形控制动作空间,并提供高速率、高维度的输出,Helix 能在各种容器中拾取和放置物品,操作抽屉和冰箱,协调灵巧的多机器人交接,并操控数千种新奇物品。文章的署名:学术君。读过之后还是有收获。但我个人觉得,这不过是“AI大展宏图”中的一朵“浪花”。现在的技术几乎是“时新日异”,甚至可以“秒读”。如果作者能做些技术前沿的比较研究和展望也许更有价值。另外,本文是拷贝https://www.figure.ai/news/helix,February 20, 2025网站的文章。但是作者没有做出说明。读者不得不自己查阅,原来这是一家美国专注于构建AI赋能仿人机器人的公司,总部位于加州桑尼维尔(Sunnyvale)。由此看到,此文不够严谨与规范,这会让读者联想到作者投机取巧。)

2)用DeepSeek做科研靠谱吗?科研人员:相当于博士水平,搭框架、写代码不在话下 2025-2-19 浙江省科学技术协会 原创 AI 科研 人工智能 DeepSeek(点评:DeepSeek是乙巳年伊始最热门的话题。我已经用它做过实验。其实如同读《哈姆雷特》一样,一千个读者有一千个不同的理解。这项AI技术在某些方面的确可以协助我们做些事,比如,英译中的翻译能力较强,提高了劳动者的效率;查找资料、为论文做出点评(前提是提出有价值的问题)都有一定的能力。然而,问题也是显而易见的,比如,会提供不够真实的资料文献线索,有局限性、机械性、“抖机灵”、张冠李戴、“线路繁忙而中断回答”等等。毋庸置疑,DeepSeek是靠海量大规模的数据和计算能力而提高准确度。关键问题是“科研人员:相当于博士水平,搭框架、写代码不在话下”的标题实在是有一种误导倾向,难道教人放弃学术研究的独立思考和独辟蹊径?总之,我们应看到DeepSeek利弊共存的两面性,这也许更符合科学精神。)

3)比尔·盖茨都喜欢吃的人造肉,它的味道怎么样?2025-2-18 2024年度科普中国资源荟萃集成示范项目 人造肉(点评:这篇文章图文并茂,其概念、立论、结构、问题意识、数据、讨论与结论都比较耐读。遗憾的是一周过去只有26位读者,也耐人寻味。中国人对“人造肉”是不喜欢,不了解,非天然,价格高、不环保、工艺复杂等因素影响了大众对它的“亲近”和“接受?比尔盖茨喜欢,我们也需要喜欢吗?我觉得这方面更值得关注和追踪研究,以及传播相应的文章。不过,我觉得文章还是不错。)

4)DeepSeek新模型有何亮点?专家:真正意义上让AI像人一样思考 2025-2-13 浙江省科学技术协会 原创 人工智能 前沿科技 大模型 DeepSeek(点评:本文介绍了DeepSeek的升级版,指出对此前存在的一些问题做了技术“微调”。正如有评论者所留下的感言:“DeepSeek新模型凭借其在技术架构、学习能力、语义理解、推理决策以及情感感知与表达等多方面的亮点,真正开启了AI像人一样思考的新时代。它的出现不仅为人工智能领域带来了新的突破和发展方向,也将在众多行业和领域中发挥巨大的作用,为人类社会的进步和发展带来深远影响。随着技术的不断完善和创新,我们有理由相信,DeepSeek新模型以及类似的人工智能技术将在未来创造更多的奇迹,让我们的生活变得更加美好。”我作为一名技术理性学者,却觉得我们在推进技术极快速度迭代的背景下,更应该重视人的存在价值。如果AI将来能替代人做出‘真正意义上让AI像人一样思考’的结果,人的前景是什么?对此我们必须有足够的警觉。而“真正开启了AI像人一样思考的新时代”这个结论,不敢苟同。)

5) 我们用最近很火的DeepSeek挑战了物理所出的竞赛题,结果……2025-2-7科普中国AI 推理 奥赛 DeepSeek挑战了物理所出的竞赛题,结果 (点评:这篇文章的题目带有“悬念”,“DeepSeek挑战了物理所出的竞赛题,结果……”增强了读者的求知欲,觉得一睹为快。在我看来,这也算对DeepSeek能力的考验和检验。其结果:“首先是 AI 的思路是真的好,基本上没有无法下手的题,甚至很多时候一下子就能找到正确的思路。但跟人类不同的是,它们在有正确的思路后,会在一些很简单的错误里面打转。比如……但是 R1 似乎是在反复的猜测和试错,到最后也没有得到简正坐标的表达式。还有就是所有的 AI 似乎都不理解一个“严密”的证明究竟意味着怎样的要求,似乎认为能在形式上凑出答案,就算是证明了。AI 如同人类,也会出现许多“偶然”错误。……我们私下尝试过多次,很多时候 Claude-sonnet 可以正确解出第一题的答案,但正式测试的那次它就偏偏做错了。出于严谨,我们也许应该对同一道题测试多次然后取平均,但实在是有点麻烦……”。这篇文章用实证,为DeepSeek“揭了短”。无论如何,在强大的科技创新和伟业频出的背景下,不能盲目跟风,需要保持必要的冷静、客观和独立意识。)

6)从中国文化视角解析大模型训练之道:以DeepSeek为例 2025-2-5 张艺畅 原创 人工智能 数据采集 大模型训练 DeepSeek(点评:本文从数据收集、模型预训练、微调优化等关键环节,结合中华传统文化中的哲学思想,揭示大模型训练过程中蕴含的文化密码,突破了仅限于技术解读的视野,添加了中华传统文化中的哲学思想给DeepSeek“喂料”。因此,作者说“通过强化学习从人类反馈(RLHF),建立包含50万条标注数据的道德评估体系。在敏感话题处理上,模型展现出"发而皆中节"的审慎态度,有害内容拒绝率高达98.6%。文化适配方面,开发"文化感知"模块,使模型对传统节俗的理解准确度达到92%,在古诗词意象解析任务中超越人类平均水平。”对此“结论”(或是评价),其他方面,我没有做过实验,无法肯定或否定。但在对“古诗词意象解析任务中超越人类平均水平”的说法,我有异议,即夸大了人工智能的能力。我觉得作者对古诗词与人的关系理解得不够深刻。在我的理解和个人体验中,“诗为心声”,“诗言志”、“诗传神”等等是人的心神、境遇、情感、灵性等“巧遇”在一起的产物。我相信,无论什么时候,人工智能也无法把一首诗词做出精妙的理解,只不过是抖抖机灵而已。至于创造出所谓“诗作”,可以说一眼就能识破。因为这种诗作乍一看很美,甚至精致,但是不温暖,是“钢铁”传递的“热”。在DeepSeek大流行中,尽量不炒作,不添油加醋。)

7)让AI自发推理!引发热议的“DeepSeek”到底是个啥?2025-01-29 AI 人工智能 股票 DeepSeek 科普中国(点评:本文是介绍DeepSeek横空出世后最早的文章之一。介绍了这项技术的主要特点:“采用了完全开源策略,不仅降低了用户的使用门槛,还促进了AI开发者社区的协作生态。通过开源,DeepSeek吸引了大量开发者和研究人员的关注,推动了AI技术的发展。英伟达AI科学家Jim Fan称赞DeepSeek是‘真正开放的前沿研究,赋能所有人’”。作者也介绍了“开源也面临着保护知识产权和开源社区秩序维护等挑战,比如开源项目拥有的版权,开源与闭源之争,在特定场景和时代背景下的有效性对比”等问题。作者最后也指出:“从整个AI大模型产业来看,DeepSeek的成功或许代表了一种全新的发展方向——通过算法优化而非单纯依赖算力和数据量来提升模型性能。这一方向也为AI大模型产业的发展提供了新的思路。”这篇文章是基于央视新闻、中央广电总台中国之声、新华社等新闻媒体的报导内容整理而成的,且在乙巳年春节的第二天,反应速度快,报导也中规中矩。)

本期总体评价及感言:

本月《前沿》栏目关于介绍DeepSeek的文章占比较多,说明“科普中国”的迅捷性、敏锐性和责任感,尤其是在中国最重要的传统佳节期间。

本期点评的七篇文章中六篇涉及DeepSeek。多篇文章是专业技术性的介绍,对于了解中国AI技术创新做了多方位与多领域的介绍。对公众尽快接触这项成果大有裨益。

存在的问题与建议:

1)多篇介绍文章有相似和雷同。主要以专业技术为主,缺少各个篇章中的递进关系。说明对这一人工智能创新的理解和传播构架没来得及设计。情有可原是在春节期间。

2)几乎所有的文章都表达出“技术万能”的倾向,缺少人文视角的学术关怀和人文情怀。如何引导和启迪技术创新者、文章写作者、阅读者,以正确和理智的态度看待人与人工智能的关系;人工智能的最终目的;人在未来将何去何从;人工智能的风险与挑战;科技伦理如何得到普及等等问题基本没有涉及,有点遗憾。

3)人工智能,目前是世界各国科技研发的“高地”,每天几乎都有新的“创新”成果问世。基于这样的背景,我们是否可以组织真正的科普专家做些中外成果的对比研究,因为,没比较,就没鉴别。要不然妄自尊大,要不然妄自菲薄,要不然雾里看花,要不然自以为是。促进进步需要横向与纵向的比较。既要引导公众学会欣赏科技的最新成果,也要引导公众正确判断一项技术成果的可信度、可识别度。

4)个别文章作者写作不够严谨,比如:“据最新资料……”应当给出最新资料的来源、时间、地点、人物等信息。这些是新闻稿的基本要素。题目仍有哗众取宠之嫌,有的文章没有审定人,都不够严肃。另外,“用DeepSeek做科研靠谱吗?科研人员:相当于博士水平,搭框架、写代码不在话下”的题目有误导之嫌,不甚严肃,不符合科学传播的要义,特别是由省科协级别发表,其误导性更强。这些问题的出现说明“科普中国”筛选文章过程把关不严。亟待改进!

5)大多文章都是“二手资料”,如何署名?如何保护原创者(或首发者的版权)是“科普中国”需要思考和做出合理的要求。这个问题还比较突出,直接挑战科学精神的原则。

以上点评和建议仅供参考。

马惠娣(2025年2月25日)