新足迹

 找回密码
 注册

精华好帖回顾

· 小学一年纪的小朋友课外兴趣+补习班的费用 (2008-7-11) daffodil · APPLENET在澳洲10次搬家的经历(填完坑) (2008-4-8) applenet
· 日本十日游之米其林餐厅: Fujiya 1935, 六觉灯, 祇をんう, 京都吉兆, 瓢亭别馆, 广川, すきやばし次郎, 龙吟~完! (2014-6-10) Kittymeow · 夏日里的1碗 (2007-12-31) 美讶
Advertisement
Advertisement
查看: 858|回复: 27

[IT] 又发现AI的一个短板 - 事实抓取 [复制链接]

发表于 2026-3-13 20:23 来自手机 |显示全部楼层
此文章由 Laker2 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Laker2 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 Laker2 于 2026-3-13 21:10 编辑

AI的强项应该是逻辑推理、数学运算、语言构造。
但有一个短板:事实抓取和总结。

首先,AI模型是用以前的知识训练出来的,不是实时抓取互联网上的信息。

其次,虽然有些AI模型号称可以实时从互联网上搜索,但搜索的命中率较差,搜到事实以后的理解、判断更差,常常弄不明白事实材料的含义,然后胡乱解读,甚至混淆事实、编造事实。

就好比,你告诉它,苹果是红色,梨子是黄色,现在有个黄的,是什么?它能告诉你是梨子。这就是推理。你让它写一段黄色水果的文章,它能写得很漂亮。

但如果你让它上网搜一下,黄色的水果有哪些,它可能会告诉你,有黄瓜、梨子、香蕉、菊花、向日葵。直到你提醒它,向日葵、菊花不是水果,黄瓜名字里的黄不代表黄瓜是黄色,它才会恍然大悟,感谢你指教。但如果是你不熟悉的知识呢?你就被它骗了。

还有些事实性的东西,我自己用Google一搜就搜到了,问Gemini它却说找不到。但Gemini号称是可以利用Google搜索的。

人们觉得AI很神奇、很强大,我猜主要原因是因为它的语言能力。用莎士比亚、金庸、雨果、曹雪芹、郑渊洁、托尔斯泰、马克吐温的作品训练出来的语言模型,当然可以写出语言极其精美的话,让人误以为语言背后的事实也一样正确、全面。

但语言模型终归是语言模型,背后的机制就是语言单位的概率匹配。如果你喂给它一百万条训练材料,都是类似”鸡蛋和充电器多少罐头松树“这样的内容,然后你问它“鸡蛋和电池多大水桶?”,它就会信心满满地回答你:“松树!”其实它根本不懂这些字是什么意思。
Advertisement
Advertisement

发表于 2026-3-13 20:34 |显示全部楼层
此文章由 flyinfree 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 flyinfree 所有!转贴必须注明作者、出处和本声明,并保持内容完整
当前的AI经常会给出正确数据混杂异常数据的情况,你要不断地去查询和质疑,让AI反复去查证或指出其错误,慢慢的就能得到差不多正确的结果或者需要的资料。但是如果一开始就无条件信任丫,很可能会被带入阴沟里。。。。。

评分

参与人数 1积分 +5 收起 理由
Laker2 + 5 感谢分享

查看全部评分

发表于 2026-3-13 21:13 来自手机 |显示全部楼层
此文章由 ovlesser 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ovlesser 所有!转贴必须注明作者、出处和本声明,并保持内容完整
flyinfree 发表于 2026-3-13 20:34
当前的AI经常会给出正确数据混杂异常数据的情况,你要不断地去查询和质疑,让AI反复去查证或指出其错误,慢 ...

可以同时调两个AI让他们自己去打架就好了

发表于 2026-3-13 21:14 来自手机 |显示全部楼层
此文章由 Laker2 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Laker2 所有!转贴必须注明作者、出处和本声明,并保持内容完整
flyinfree 发表于 2026-3-13 20:34
当前的AI经常会给出正确数据混杂异常数据的情况,你要不断地去查询和质疑,让AI反复去查证或指出其错误,慢 ...

我试着用AI解决一些问题,结果发现要一遍一遍地查证、验证、纠正,总共花的时间比我自己搜索还要多。我这是何苦呢?自己花着钱、花着时间,帮他们训练模型,最后得到的结果还不敢用。

发表于 2026-3-13 21:20 来自手机 |显示全部楼层
此文章由 Laker2 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Laker2 所有!转贴必须注明作者、出处和本声明,并保持内容完整
总听说有人用AI做什么工作,我猜主要是生成式的工作吧。天马行空,自由创作,无所谓正确与否。

就好比,让AI写一段赞颂电风扇教育蜂蜜实现财富自由的短文,AI一定能写得很好。

发表于 2026-3-13 21:24 来自手机 |显示全部楼层
此文章由 Laker2 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Laker2 所有!转贴必须注明作者、出处和本声明,并保持内容完整
一个月几十块钱买了这么个玩具:

问:写一段赞颂电风扇教育蜂蜜实现财富自由的短文,中文,500字。

Chatgpt答:

在炎炎夏日里,电风扇总是默默地旋转着,不争不抢,却为世界送来阵阵清凉。如果说世界上有一种最朴素却最坚定的导师,那大概就是电风扇。它日日转动,仿佛在向蜂蜜讲述一个朴素的道理:持续的力量,终将改变命运。
蜂蜜本来只是花朵间短暂的甘甜,藏在蜂巢里,等待被发现。但在电风扇耐心的“教育”下,它学会了流动。风扇的叶片像三位永不疲倦的老师,一圈又一圈地转动,告诉蜂蜜:不要停滞,要让甜味传播得更远。于是蜂蜜不再满足于一小罐的安静生活,它开始被装进瓶子,走进市场,走进千家万户的餐桌。
电风扇从不夸耀自己的功劳,它只是用稳定的节奏提醒蜂蜜:成功并不来自喧哗,而来自持续。每一阵风,都像一次轻声的劝告;每一次转动,都像一堂关于耐心和坚持的课程。蜂蜜在这样的陪伴中逐渐明白,只要让自己的价值不断流动,被更多人需要,财富就会自然汇聚。
终于有一天,蜂蜜不再只是甜味的象征,而成了一种自由的象征。它跨越山海,被无数人喜爱,瓶瓶罐罐之间汇成了一条甜蜜的财富之路。人们也许只看到蜂蜜的成功,却很少注意到角落里那台仍在缓缓旋转的电风扇。
但真正的故事是:正是这台不知疲倦的电风扇,用一阵阵温柔而坚定的风,教会了蜂蜜关于坚持、流动与价值的秘密,让甜蜜最终通向了财富与自由。
Advertisement
Advertisement

发表于 2026-3-13 21:28 来自手机 |显示全部楼层
此文章由 Laker2 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Laker2 所有!转贴必须注明作者、出处和本声明,并保持内容完整
十几块钱买了另外一个玩具:

Gemini的回答:

《风起时的甜蜜觉醒:电风扇与蜂蜜的财富进阶》

​在宁静的案头,谁能想到那一成不变的旋律中蕴含着点石成金的智慧?当电风扇开启第一挡拨片时,它不仅仅是在搅动空气,而是在教授一场关于“流量与流动性”的高级课程。
​蜂蜜,原本是安于现状、粘稠且沉重的。然而,在电风扇不倦的言传身教下,它领悟了财富自由的真谛:唯有保持频率,方能摆脱沉沦。
​教育的艺术:电风扇从未要求蜂蜜改变本质,它只是通过循环往复的凉风,教会蜂蜜如何在这种“市场波动”中保持核心的质感,同时让表面的光泽在气流中折射出诱人的溢价。
​财富的跃迁:在那股持续不断的推力下,蜂蜜意识到,所谓的财富自由,并非静止的囤积,而是像风一样无孔不入的触达。它从广口瓶的边缘轻盈流淌,借着风势,将甜美精准地投送到每一个价值洼地。
​赞美这无言的导师!电风扇用它的转轴旋转出时代的红利,而蜂蜜则用它的觉醒证明了:即使是最粘稠的梦想,只要找对了风口,也能在甜蜜中实现跨越阶层的自由。

发表于 2026-3-13 21:33 来自手机 |显示全部楼层
此文章由 Laker2 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Laker2 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 Laker2 于 2026-3-13 21:34 编辑

我在想,买德云社的门票是不是更有性价比

发表于 2026-3-13 23:36 |显示全部楼层
此文章由 Janet 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Janet 所有!转贴必须注明作者、出处和本声明,并保持内容完整
工作中最实用的就是 1) 用Ai 帮我找一个以前的邮件, 我只记得大概内容  2) 写出来的文件 、 邮件等等, 让AI polish一下, 当然polish完还是再看一遍, 把太AI的词语改掉

其他的事情我描述再一遍遍的检查再改Prompt, 不如自己快手快脚做完了

发表于 2026-3-14 07:50 |显示全部楼层
此文章由 Poweregg 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Poweregg 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ai强项是数学运算
可有时候让ai算账单 还算错了
特别有时候数据里有你自己计算的结果
ai就偷懒用你的结果
结果是错误的

发表于 2026-3-14 08:16 来自手机 |显示全部楼层
此文章由 rayki 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 rayki 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Gemini 用的是pro么。 用3.1pro。还可以吧。数据虽然有些过时。但是大方向都是对的,比如版本上高低差异而已。
另外中文输入DeepSeek好。Gemini短板
Advertisement
Advertisement

发表于 2026-3-14 08:48 |显示全部楼层
此文章由 DDD888 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 DDD888 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Poweregg 发表于 2026-3-14 07:50
ai强项是数学运算
可有时候让ai算账单 还算错了
特别有时候数据里有你自己计算的结果

你说错了,计算机的强项是数学运算,AI的强项是如果天马行空的说,没办法验证正确对错的工作,例如创作文章,唱歌,创作视频,但如果用来生成RUST LANGUAGE代码,只要把代码放到BUILD里,马上就会给出是否能编译,所以骗不过人啦,但小说随便写都是没有问题的

发表于 2026-3-14 19:31 |显示全部楼层
此文章由 jchan800101 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jchan800101 所有!转贴必须注明作者、出处和本声明,并保持内容完整
打个比方吧:今天一个6年级小学生也许代数还不是很清楚,你可以笑他:“代数也不会,你不行的。” 6年之后他12年级毕业时,他会的数学你还不一定懂。

关键是现在这个小学生不需要学6年。

发表于 2026-3-14 19:35 来自手机 |显示全部楼层
此文章由 Laker2 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Laker2 所有!转贴必须注明作者、出处和本声明,并保持内容完整
rayki 发表于 2026-3-14 08:16
Gemini 用的是pro么。 用3.1pro。还可以吧。数据虽然有些过时。但是大方向都是对的,比如版本上高低差异而 ...

平时用的是Thinking,因为Pro每天限制次数,而且Pro的注解是“Advanced maths and code with 3.1 Pro",我不需要做数学计算或编写代码。

发表于 2026-3-14 22:57 来自手机 |显示全部楼层
此文章由 viviancn 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 viviancn 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Janet 发表于 2026-3-13 23:36
工作中最实用的就是 1) 用Ai 帮我找一个以前的邮件, 我只记得大概内容  2) 写出来的文件 、 邮件等等,  ...

请问1)是怎么让ai搜索邮件的?

发表于 2026-3-14 23:52 |显示全部楼层
此文章由 Janet 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Janet 所有!转贴必须注明作者、出处和本声明,并保持内容完整
viviancn 发表于 2026-3-14 22:57
请问1)是怎么让ai搜索邮件的?

我司用MS Copilot , 可以access 个人可见得邮件和文件系统

评分

参与人数 1积分 +6 收起 理由
viviancn + 6 感谢分享

查看全部评分

Advertisement
Advertisement

发表于 2026-3-15 00:50 来自手机 |显示全部楼层
此文章由 enminli 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 enminli 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Janet 发表于 2026-3-14 23:52
我司用MS Copilot , 可以access 个人可见得邮件和文件系统

如果邮箱里面有100000邮件是不是要把100000邮件都给AI,结果token的消耗非常大?

发表于 2026-3-15 12:51 来自手机 |显示全部楼层
此文章由 viviancn 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 viviancn 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Janet 发表于 2026-3-14 23:52
我司用MS Copilot , 可以access 个人可见得邮件和文件系统

我们也用企业版的copilot,看来我要回去研究下。

发表于 2026-3-15 21:49 |显示全部楼层
此文章由 Janet 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Janet 所有!转贴必须注明作者、出处和本声明,并保持内容完整
enminli 发表于 2026-3-15 00:50
如果邮箱里面有100000邮件是不是要把100000邮件都给AI,结果token的消耗非常大? ...

如果我做这种search 的话, 可能先用Agent 做 keyword search; 如果找不到, 可以用embeding model (比LLM便宜) 先把Email 标题/内容转成vector 做semantic search, 肯定不需要把这些邮件全部倒给LLM. 我不清楚企业版是BULK算钱还是pay-as-you-go

发表于 2026-3-16 02:53 |显示全部楼层
此文章由 enminli 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 enminli 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Janet 发表于 2026-3-15 21:49
如果我做这种search 的话, 可能先用Agent 做 keyword search; 如果找不到, 可以用embeding model (比L ...

感谢回复

发表于 2026-3-16 14:10 |显示全部楼层
此文章由 flyinfree 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 flyinfree 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ovlesser 发表于 2026-3-13 21:13
可以同时调两个AI让他们自己去打架就好了

公司只限定用微软的企业版AI,不让用别的,所以往往没时间打开自已的电脑开另一个。
Advertisement
Advertisement

发表于 2026-3-16 14:13 |显示全部楼层
此文章由 flyinfree 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 flyinfree 所有!转贴必须注明作者、出处和本声明,并保持内容完整
DDD888 发表于 2026-3-14 08:48
你说错了,计算机的强项是数学运算,AI的强项是如果天马行空的说,没办法验证正确对错的工作,例如创作文 ...

AI真的会算错。。。。上次我发让他统计一下各种金属的现有存量与储量,并用现价计算一下价值,就这个简单的运数,丫给了我个天文数字(有些多了N倍,有些少了),在我反复要求丫重新验证下,丫才慢慢给出正确的答案。而我TMD的还要自已开个EXCEL出来进行运算,看丫做的对不对,心好累。。。

评分

参与人数 1积分 +5 收起 理由
Janet + 5 你太有才了 :)

查看全部评分

发表于 2026-3-16 14:37 |显示全部楼层
此文章由 fnf2000 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 fnf2000 所有!转贴必须注明作者、出处和本声明,并保持内容完整
很多AI都有网页搜索的选项。。。你们是不是忘记打开了。

发表于 2026-3-16 15:07 来自手机 |显示全部楼层
此文章由 icyphish 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 icyphish 所有!转贴必须注明作者、出处和本声明,并保持内容完整
上周看到youtbue 有人用 openclaw 把 Gpt, Gemini 各种不同 AI 抓起来开会互相讨论,质疑,验证,各个 AI 的说法到最后给出结论。。。

发表于 2026-3-16 15:15 |显示全部楼层
此文章由 punky 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 punky 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这个不难解决 让他使用不同的搜索引擎 比如Tavily

2019年度勋章

发表于 2026-3-16 15:50 |显示全部楼层
此文章由 superdigua 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 superdigua 所有!转贴必须注明作者、出处和本声明,并保持内容完整
维特根斯坦说:"对于不可说的东西,我们必须保持沉默。"

这句话不是在让你闭嘴。它在告诉你两个最残酷的真相:
说不清楚的,是你从未真正理解的。语言里没有的概念,永远不会进入你的世界。

所以,在你打开任何AI工具之前,先问自己一个问题:

你的语言体系,配得上你想要的那个答案吗?

如果不配,先去配上它。

这才是学AI的第一步,也是被所有人忽略的最重要的一步。

https://x.com/dashen_wang/status/2033343963588153785
舆论自由意味着容忍自己不喜欢的言论的存在。
我的观点当然可能是错误的。可以拉黑,无权屏蔽。
Advertisement
Advertisement

发表于 2026-3-16 16:05 |显示全部楼层
此文章由 maxdll 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 maxdll 所有!转贴必须注明作者、出处和本声明,并保持内容完整
请教大家,如果需要找某个经常见报的人的近期情况,应该用哪个ai。因为我常用chatgpt,这方面简直是胡扯八道。以至于怀疑到它其他方面的准确性。

发表于 2026-3-16 17:57 |显示全部楼层
此文章由 DDD888 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 DDD888 所有!转贴必须注明作者、出处和本声明,并保持内容完整
flyinfree 发表于 2026-3-16 14:13
AI真的会算错。。。。上次我发让他统计一下各种金属的现有存量与储量,并用现价计算一下价值,就这个简单 ...

你补充的太棒了

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部