简而言之,计算机学习的是单词的使用频率和不同的词一起出现的频率和顺序,和相似程度

来源: 风景线2 2021-11-03 08:07:36 [] [旧帖] [给我悄悄话] 本文已被阅读: 0 次 (454 bytes)

这是可以通过从大量的文本样品中用机器学习的方法学出来。所有的单词都是用数字symbolized. 

如果训练集中有topic信息,机器可以学出哪些词用得更多,然后可以在训练集里根据词频计算出不同topic的可能性.

这里经常有很多伪专家,说了一大通,却回答不了简单问题。你上网查youtube应该能找到简单准确的解释

所有跟帖: 

好的:)回头让娃去油管上找。 谢了 -两女宝妈- 给 两女宝妈 发送悄悄话 两女宝妈 的博客首页 (0 bytes) () 11/03/2021 postreply 08:11:29

回你一下 -uban- 给 uban 发送悄悄话 (1378 bytes) () 11/03/2021 postreply 09:41:38

算probability只是一种适合给小孩解释的早期算法。现在的自然语言学习都是用deep neural network算的 -风景线2- 给 风景线2 发送悄悄话 (351 bytes) () 11/03/2021 postreply 10:01:49

加跟帖:

当前帖子已经过期归档,不能加跟帖!