欢迎进入中国休闲研究网站

Welcome to the Website of Chinese Leisure Studies

阅读与点评（二）

2025年1月25-2025年2月25日

抽验方法说明：抽检式、随机性、参考同类型、尊重科学精神、尊重知识版权

评价标准：选题新颖、文理兼备、知识性与趣味性、启蒙启发与启智、语言通俗易懂、思想与方法、原创性、跨学科性等。

1）机器人大升级？像人类一样推理，“拿捏”任意家庭用品！上传时间：2025-2-24 学术头条 AI 机器人推理（点评：本文介绍了Figure AI 发布的首个通用视觉-语言-行动（VLA）模型——Helix，这项技术的研发特色是让AI能像人类一样推理，将感知、语言理解和学习控制融为一体，并通过自然语言直接控制人形机器人整个上半身。在 Helix 中，新技能可以用语言即时指定。在这项研究中，Helix 展现出了训练效率高且仅需要单一权重集的特点。这种收集规模与现代的单任务模仿学习数据集更相近。尽管对数据的要求相对较低，但 Helix 仍能扩展到更具挑战性的上半身人形控制动作空间，并提供高速率、高维度的输出，Helix 能在各种容器中拾取和放置物品，操作抽屉和冰箱，协调灵巧的多机器人交接，并操控数千种新奇物品。文章的署名：学术君。读过之后还是有收获。但我个人觉得，这不过是“AI大展宏图”中的一朵“浪花”。现在的技术几乎是“时新日异”，甚至可以“秒读”。如果作者能做些技术前沿的比较研究和展望也许更有价值。另外，本文是拷贝https://www.figure.ai/news/helix，February 20, 2025网站的文章。但是作者没有做出说明。读者不得不自己查阅，原来这是一家美国专注于构建AI赋能仿人机器人的公司，总部位于加州桑尼维尔（Sunnyvale）。由此看到，此文不够严谨与规范，这会让读者联想到作者投机取巧。）

2）用DeepSeek做科研靠谱吗？科研人员：相当于博士水平，搭框架、写代码不在话下 2025-2-19 浙江省科学技术协会原创 AI 科研人工智能 DeepSeek（点评：DeepSeek是乙巳年伊始最热门的话题。我已经用它做过实验。其实如同读《哈姆雷特》一样，一千个读者有一千个不同的理解。这项AI技术在某些方面的确可以协助我们做些事，比如，英译中的翻译能力较强，提高了劳动者的效率；查找资料、为论文做出点评（前提是提出有价值的问题）都有一定的能力。然而，问题也是显而易见的，比如，会提供不够真实的资料文献线索，有局限性、机械性、“抖机灵”、张冠李戴、“线路繁忙而中断回答”等等。毋庸置疑，DeepSeek是靠海量大规模的数据和计算能力而提高准确度。关键问题是“科研人员：相当于博士水平，搭框架、写代码不在话下”的标题实在是有一种误导倾向，难道教人放弃学术研究的独立思考和独辟蹊径？总之，我们应看到DeepSeek利弊共存的两面性，这也许更符合科学精神。）

3）比尔·盖茨都喜欢吃的人造肉,它的味道怎么样？2025-2-18 2024年度科普中国资源荟萃集成示范项目人造肉（点评：这篇文章图文并茂，其概念、立论、结构、问题意识、数据、讨论与结论都比较耐读。遗憾的是一周过去只有26位读者，也耐人寻味。中国人对“人造肉”是不喜欢，不了解，非天然，价格高、不环保、工艺复杂等因素影响了大众对它的“亲近”和“接受？比尔盖茨喜欢，我们也需要喜欢吗？我觉得这方面更值得关注和追踪研究，以及传播相应的文章。不过，我觉得文章还是不错。）

4）DeepSeek新模型有何亮点？专家：真正意义上让AI像人一样思考 2025-2-13 浙江省科学技术协会原创人工智能前沿科技大模型 DeepSeek（点评：本文介绍了DeepSeek的升级版，指出对此前存在的一些问题做了技术“微调”。正如有评论者所留下的感言：“DeepSeek新模型凭借其在技术架构、学习能力、语义理解、推理决策以及情感感知与表达等多方面的亮点，真正开启了AI像人一样思考的新时代。它的出现不仅为人工智能领域带来了新的突破和发展方向，也将在众多行业和领域中发挥巨大的作用，为人类社会的进步和发展带来深远影响。随着技术的不断完善和创新，我们有理由相信，DeepSeek新模型以及类似的人工智能技术将在未来创造更多的奇迹，让我们的生活变得更加美好。”我作为一名技术理性学者，却觉得我们在推进技术极快速度迭代的背景下，更应该重视人的存在价值。如果AI将来能替代人做出‘真正意义上让AI像人一样思考’的结果，人的前景是什么？对此我们必须有足够的警觉。而“真正开启了AI像人一样思考的新时代”这个结论，不敢苟同。）

5) 我们用最近很火的DeepSeek挑战了物理所出的竞赛题，结果……2025-2-7科普中国AI 推理奥赛 DeepSeek挑战了物理所出的竞赛题，结果 (点评：这篇文章的题目带有“悬念”，“DeepSeek挑战了物理所出的竞赛题，结果……”增强了读者的求知欲，觉得一睹为快。在我看来，这也算对DeepSeek能力的考验和检验。其结果：“首先是 AI 的思路是真的好，基本上没有无法下手的题，甚至很多时候一下子就能找到正确的思路。但跟人类不同的是，它们在有正确的思路后，会在一些很简单的错误里面打转。比如……但是 R1 似乎是在反复的猜测和试错，到最后也没有得到简正坐标的表达式。还有就是所有的 AI 似乎都不理解一个“严密”的证明究竟意味着怎样的要求，似乎认为能在形式上凑出答案，就算是证明了。AI 如同人类，也会出现许多“偶然”错误。……我们私下尝试过多次，很多时候 Claude-sonnet 可以正确解出第一题的答案，但正式测试的那次它就偏偏做错了。出于严谨，我们也许应该对同一道题测试多次然后取平均，但实在是有点麻烦……”。这篇文章用实证，为DeepSeek“揭了短”。无论如何，在强大的科技创新和伟业频出的背景下，不能盲目跟风，需要保持必要的冷静、客观和独立意识。)

6）从中国文化视角解析大模型训练之道：以DeepSeek为例 2025-2-5 张艺畅原创人工智能数据采集大模型训练 DeepSeek（点评：本文从数据收集、模型预训练、微调优化等关键环节，结合中华传统文化中的哲学思想，揭示大模型训练过程中蕴含的文化密码，突破了仅限于技术解读的视野，添加了中华传统文化中的哲学思想给DeepSeek“喂料”。因此，作者说“通过强化学习从人类反馈（RLHF），建立包含50万条标注数据的道德评估体系。在敏感话题处理上，模型展现出"发而皆中节"的审慎态度，有害内容拒绝率高达98.6%。文化适配方面，开发"文化感知"模块，使模型对传统节俗的理解准确度达到92%，在古诗词意象解析任务中超越人类平均水平。”对此“结论”（或是评价），其他方面，我没有做过实验，无法肯定或否定。但在对“古诗词意象解析任务中超越人类平均水平”的说法，我有异议，即夸大了人工智能的能力。我觉得作者对古诗词与人的关系理解得不够深刻。在我的理解和个人体验中，“诗为心声”，“诗言志”、“诗传神”等等是人的心神、境遇、情感、灵性等“巧遇”在一起的产物。我相信，无论什么时候，人工智能也无法把一首诗词做出精妙的理解，只不过是抖抖机灵而已。至于创造出所谓“诗作”，可以说一眼就能识破。因为这种诗作乍一看很美，甚至精致，但是不温暖，是“钢铁”传递的“热”。在DeepSeek大流行中，尽量不炒作，不添油加醋。）

7）让AI自发推理！引发热议的“DeepSeek”到底是个啥？2025-01-29 AI 人工智能股票 DeepSeek 科普中国（点评：本文是介绍DeepSeek横空出世后最早的文章之一。介绍了这项技术的主要特点：“采用了完全开源策略，不仅降低了用户的使用门槛，还促进了AI开发者社区的协作生态。通过开源，DeepSeek吸引了大量开发者和研究人员的关注，推动了AI技术的发展。英伟达AI科学家Jim Fan称赞DeepSeek是‘真正开放的前沿研究，赋能所有人’”。作者也介绍了“开源也面临着保护知识产权和开源社区秩序维护等挑战，比如开源项目拥有的版权，开源与闭源之争，在特定场景和时代背景下的有效性对比”等问题。作者最后也指出：“从整个AI大模型产业来看，DeepSeek的成功或许代表了一种全新的发展方向——通过算法优化而非单纯依赖算力和数据量来提升模型性能。这一方向也为AI大模型产业的发展提供了新的思路。”这篇文章是基于央视新闻、中央广电总台中国之声、新华社等新闻媒体的报导内容整理而成的，且在乙巳年春节的第二天，反应速度快，报导也中规中矩。）

本期总体评价及感言：

本月《前沿》栏目关于介绍DeepSeek的文章占比较多，说明“科普中国”的迅捷性、敏锐性和责任感，尤其是在中国最重要的传统佳节期间。

本期点评的七篇文章中六篇涉及DeepSeek。多篇文章是专业技术性的介绍，对于了解中国AI技术创新做了多方位与多领域的介绍。对公众尽快接触这项成果大有裨益。

存在的问题与建议：

1）多篇介绍文章有相似和雷同。主要以专业技术为主，缺少各个篇章中的递进关系。说明对这一人工智能创新的理解和传播构架没来得及设计。情有可原是在春节期间。

2）几乎所有的文章都表达出“技术万能”的倾向，缺少人文视角的学术关怀和人文情怀。如何引导和启迪技术创新者、文章写作者、阅读者，以正确和理智的态度看待人与人工智能的关系；人工智能的最终目的；人在未来将何去何从；人工智能的风险与挑战；科技伦理如何得到普及等等问题基本没有涉及，有点遗憾。

3）人工智能，目前是世界各国科技研发的“高地”，每天几乎都有新的“创新”成果问世。基于这样的背景，我们是否可以组织真正的科普专家做些中外成果的对比研究，因为，没比较，就没鉴别。要不然妄自尊大，要不然妄自菲薄，要不然雾里看花，要不然自以为是。促进进步需要横向与纵向的比较。既要引导公众学会欣赏科技的最新成果，也要引导公众正确判断一项技术成果的可信度、可识别度。

4）个别文章作者写作不够严谨，比如：“据最新资料……”应当给出最新资料的来源、时间、地点、人物等信息。这些是新闻稿的基本要素。题目仍有哗众取宠之嫌，有的文章没有审定人，都不够严肃。另外，“用DeepSeek做科研靠谱吗？科研人员：相当于博士水平，搭框架、写代码不在话下”的题目有误导之嫌，不甚严肃，不符合科学传播的要义，特别是由省科协级别发表，其误导性更强。这些问题的出现说明“科普中国”筛选文章过程把关不严。亟待改进！

5）大多文章都是“二手资料”，如何署名？如何保护原创者（或首发者的版权）是“科普中国”需要思考和做出合理的要求。这个问题还比较突出，直接挑战科学精神的原则。

以上点评和建议仅供参考。

马惠娣（2025年2月25日）