AI生成的文章数量,就已经超过了人类撰写文章的数量

今后,我们将不得不接受一个现实,就是未来80%以上, 也许更多的内容都是AI生成的。。。

 

调查的原文

https://graphite.io/five-percent/more-articles-are-now-created-by-ai-than-humans

Methodology

CommonCrawl

Common Crawl maintains one of the largest publicly available web archives. It provides billions of URLs and is used by researchers and developers, and is a key data source for training large language models.

Selection of Articles

We need a representative sample of English-language articles on the web. To do so, we randomly select 65k URLs from CommonCrawl, and confirm that each is in English, has an article schema markup, is at least 100 words, has a publish date between January 2020 and May 2025, and is an article or listicle as classified by the Graphite page type classifier.

AI Detection Algorithm

Accurate detection of AI-generated content is required to make claims about the prevalence of AI-generated articles on the web. There is a considerable disagreement about the accuracy of AI detection algorithms, and many argue that detecting AI is impossible, or at best, highly inaccurate. Many companies offer AI detection algorithms, including Originality.ai, GPTZero, Grammarly, and Surfer. 

To compute the percentage of AI-generated content in an article, we use the same algorithm described in our 2024 whitepaper, but classify each chunk using Surfer’s AI detector with a chunk size of 500 words. We classify an article as AI-generated if the algorithm predicts that more than 50% of the content is AI-generated, and human-written otherwise. 

 

所有跟帖: 

本来就信息垃圾多,别再制造垃圾了,真正的智者,没时间去看AI生成 -他乡牧歌1- 给 他乡牧歌1 发送悄悄话 他乡牧歌1 的博客首页 (0 bytes) () 10/19/2025 postreply 19:39:10

不久的将来,人类写的东西,变成了垃圾,还自以为是智者 -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (0 bytes) () 10/19/2025 postreply 19:40:12

有价值的不会变成垃圾,无价的立马就是垃圾 -他乡牧歌1- 给 他乡牧歌1 发送悄悄话 他乡牧歌1 的博客首页 (0 bytes) () 10/19/2025 postreply 19:41:41

如何定义价值呢?又该如何评估人类的智慧和脑子 vs AI的智慧和脑子, 人性的弱点 vs AI的弱点? -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (63 bytes) () 10/19/2025 postreply 19:43:14

楼上两个极端LOL, 双方都有垃圾和非垃圾。AI不应该为人造垃圾负责,但AI垃圾都是人造的 :D -有个用户名- 给 有个用户名 发送悄悄话 有个用户名 的博客首页 (0 bytes) () 10/19/2025 postreply 19:42:26

家坦AI输出之所以被一些人认为是G,就是因为大家的发言(输入)是G。。。 - 未完的歌 -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (0 bytes) () 10/19/2025 postreply 19:45:25

先声明:我是对事不是针对未歌哈,日本那个发明LEC蓝光的说过 -他乡牧歌1- 给 他乡牧歌1 发送悄悄话 他乡牧歌1 的博客首页 (185 bytes) () 10/19/2025 postreply 19:46:55

知道,知道的 :D -有个用户名- 给 有个用户名 发送悄悄话 有个用户名 的博客首页 (0 bytes) () 10/19/2025 postreply 19:48:25

那个人我知道,谈不上多伟大,也不是啥智者,最多是个发明家,一个日本匠人而已。千万不要把他的话当真理 -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (0 bytes) () 10/19/2025 postreply 19:49:23

我做过汉字检索,Al先驱,不可能检索出数据库没有的数据,尽管现在发展了 -他乡牧歌1- 给 他乡牧歌1 发送悄悄话 他乡牧歌1 的博客首页 (110 bytes) () 10/19/2025 postreply 20:04:18

AI已经学完人类的知识了,下一步就是自我学习,包括人类知识体系创造出新的知识体系,进一步学习, -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (0 bytes) () 10/19/2025 postreply 20:14:01

造谣造假的代价更低了。 -katies- 给 katies 发送悄悄话 (0 bytes) () 10/19/2025 postreply 19:42:49

AI没有情绪,也没有潜意识。。 -无发有天- 给 无发有天 发送悄悄话 (93 bytes) () 10/19/2025 postreply 19:44:38

会有的。AI之父从另一个角度看这个问题: 我们大多数人对”心智“的理解,是错误的。。。 -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (81 bytes) () 10/19/2025 postreply 19:46:32

老魏,这个不是意识。 当AI感知到物体在旁边时,嘴上说,“物体在旁边“,心里划过”我会不会看错了“ 这个才是意识。。 -无发有天- 给 无发有天 发送悄悄话 (68 bytes) () 10/19/2025 postreply 19:55:15

我知道你在说什么,自主意识,AI能不能有自我意识是我唯一的疑问,其他都不难,包括你说的情绪 -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (0 bytes) () 10/19/2025 postreply 19:58:07

这篇文章也是AI 写的。。以后引导人使用AI的文章都是AI写的。。 -zhuangqiushui- 给 zhuangqiushui 发送悄悄话 zhuangqiushui 的博客首页 (0 bytes) () 10/19/2025 postreply 20:01:55

当然是辛顿最新访谈的内容,1个多小时的访谈,有兴趣你可以听一下 -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (214 bytes) () 10/19/2025 postreply 20:12:07

呵呵,一个多小时,没工夫看,估计你也没看,是不是AI 帮你做了summary?以后ai写ai 看,没你什么事了 -zhuangqiushui- 给 zhuangqiushui 发送悄悄话 zhuangqiushui 的博客首页 (0 bytes) () 10/20/2025 postreply 00:17:51

Google最新发布AI肿瘤基因变异检测模型,首个跨测序平台跨癌种的 AI 突变检测系统。那个智者能做到? -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (753 bytes) () 10/19/2025 postreply 19:55:04

请您先登陆,再发跟帖!