有趣诱人的AI

来源: M45 2018-06-21 07:22:29 [] [博客] [旧帖] [给我悄悄话] 本文已被阅读: 次 (6074 bytes)

前些日子有消息称Google在网上免费公开了他们的AI课程.这不由地让我联想到万众瞩目的围棋人机大战的场景, 这场大战最终以阿尔法狗打遍天下无敌手大获全胜. 一时间吸足了眼球,议论鼎沸。

我抱着想知道他们究竟用的是什么方法赢了李世石九段的好奇心情,去参加了AI公开课, 读了一遍, 结果不但没找到有关的信息,也没有看出所以然来.只觉得枯燥乏味.可是不甘心啊,又读了第二遍.这遍是以另一种真心学习的心态去读的.这次大致搞懂了AI在做什么,怎么做.AI技术也让一些很平常的概念有了外延,开阔了思路.比如:止损,深度学习,训练等等.

为了加深对AI的理解,我决定建立一个测试AI的环境,体验一下人工智能非凡的智慧.这次仍然采用使用开源软件的老办法 -- 去网上下载免费软件搭建AI环境.实验的内容很简单:文字识别(OCR)和人脸识别.

这两个实验的内容其实都是老话题老技术了.OCR二十多年前就有了,我用过,但是当时不理解计算机是如何把图形变成文本文字的.人脸识别也是几年前就有很成功的案例了.现在最新的技术是让AI理解人的真实意图,帮助人类做些力所能及的事情.比如用亚马逊智能音响订外卖. 给AI一幅画,让它根据画意谱曲唱歌.国内有一个叫小帅的AI家教产品,可以辅导孩子学习.如果小孩有不懂的问题,可以直接问小帅."小帅,梯形的面积怎么算?",小帅会立刻回答"上底加下底乘高除二.".

我的实验结果如下:
先来个简单的OCR实验.四行Python代码就可以把图象中的文字转换成文本格式的文字.

图1.别问我这张笑话图是哪里来的.你问AI或许能回答你.嘿嘿嘿

运行OCR后的结果是267个字符仅仅出现了一处错误.效果不错.

‘A.J. JAMAL: FREE CATS:

Cats are cool because you don't have to
buy them. You see them on the street,
take them home -- they're yours. You
ain't never seen a cat being bought out of
a pet store. They just sit in the pet store.
They're under there like, 'Meow,' and

you be looking at them like, 'Oh they're
so cute. Let's go find one like that.’

再来个人脸识别实验.人脸识别比较复杂些.基本方法是搜集足够多的某人(憨豆)的照片.让AI识别出憨豆的脸部,训练AI识别他的脸部特征.然后再另外找一张照片去让AI识别照片里的人是谁.

图2,搜集憨豆的照片.这个是越多越好.


图3,用AI人脸识别的方法把憨豆的脸部采集出来.挑拣出清晰的可辨的人脸,用于下一步的训练.


图4,AI训练,结果成功率趋向97%.这已经非常好了.因为你也可能会认错人.

好,现在AI已经应该具备了认人的功能了.我这里现在除了憨豆,还有Ella,Selina2个人的标签.我让AI识别5张照片.其中dog和soccerboy没有标签,看了识别后的结果我笑了.不过说明一个问题.只要有足够多的标签和样本,AI判别事物还是很准的.这一下就能领悟为什么阿尔法狗只字不提棋谱的事情的道理了.

照片:bean.jpg
 0, name: bean, 可信度: 100.0%,
 1, name: ella, 可信度: 0.0%,
 2, name: selina, 可信度: 0.0%

照片:dog.jpg
 2, name: selina, 可信度: 84.3%,
 1, name: ella, 可信度: 15.7%,
 0, name: bean, 可信度: 0.0%

照片:ella.jpg
 1, name: ella, 可信度: 100.0%,
 0, name: bean, 可信度: 0.0%,
 2, name: selina, 可信度: 0.0%

照片:selina.jpg
 2, name: selina, 可信度: 99.9%,
 1, name: ella, 可信度: 0.1%,
 0, name: bean, 可信度: 0.0%

照片:soccerboy.jpg
 0, name: bean, 可信度: 100.0%,
 1, name: ella, 可信度: 0.0%,
 2, name: selina, 可信度: 0.0%

好吧, 这的确很有诱惑力,不过搜集原始数据是非常辛苦的. 所以很多网站都在疯狂收集信息,甚至盗卖个人信息. 还记得小马扎去国会答辩吗?呵呵呵. 注意哦, 欧盟已经开始执行通用信息保护条例了. 这事情要是现在搁在欧洲,FB不是胳膊折,就是腿断. 又扯远了. 大家如果有兴趣,可以体会一下AI神奇的功能, Google,微软,百渡,FB,都有很多免费的AI产品.




更多我的博客文章>>>

所有跟帖: 

最近没见你原来是去研究这个了。 -笑比哭好- 给 笑比哭好 发送悄悄话 笑比哭好 的博客首页 (0 bytes) () 06/21/2018 postreply 07:41:09

城会玩儿 -500miles- 给 500miles 发送悄悄话 500miles 的博客首页 (0 bytes) () 06/21/2018 postreply 07:49:12

没有比AI更能开脑洞的了。 -M45- 给 M45 发送悄悄话 M45 的博客首页 (0 bytes) () 06/21/2018 postreply 08:58:49

国内现在人脸识别取样的时候要你做十几种“标准表情”,好像还照三维照片,以便将来准确识别 -500miles- 给 500miles 发送悄悄话 500miles 的博客首页 (178 bytes) () 06/21/2018 postreply 07:48:46

然后随便一个谁开演唱会都能抓到好几个通缉犯。 -笑比哭好- 给 笑比哭好 发送悄悄话 笑比哭好 的博客首页 (0 bytes) () 06/21/2018 postreply 08:18:59

萧敬腾演唱会只能抓一群落汤鸡 -500miles- 给 500miles 发送悄悄话 500miles 的博客首页 (0 bytes) () 06/21/2018 postreply 09:00:02

没有很好的识别基准,AI一般都会想小孩胡说一气。 -M45- 给 M45 发送悄悄话 M45 的博客首页 (0 bytes) () 06/21/2018 postreply 09:04:42

有意思。真有精力。赞。 -wingreen- 给 wingreen 发送悄悄话 wingreen 的博客首页 (0 bytes) () 06/21/2018 postreply 09:37:11

要是没意思,也就没那意思了. -M45- 给 M45 发送悄悄话 M45 的博客首页 (169 bytes) () 06/21/2018 postreply 16:39:50

这年头ai打赢李世石不算本事,要压准世界杯才叫真ai -atravel- 给 atravel 发送悄悄话 (0 bytes) () 06/21/2018 postreply 12:06:21

再下一步就是打个响指 -500miles- 给 500miles 发送悄悄话 500miles 的博客首页 (0 bytes) () 06/21/2018 postreply 12:39:28

对厚,今年笑坛怎么没开赌盘?我赌。。。。现在还剩下哪些队伍? -紫色海洋- 给 紫色海洋 发送悄悄话 紫色海洋 的博客首页 (0 bytes) () 06/21/2018 postreply 12:53:14

你还是去买包吧 -500miles- 给 500miles 发送悄悄话 500miles 的博客首页 (0 bytes) () 06/21/2018 postreply 13:39:46

记得上次人家可是赢了..... 然后.... -M45- 给 M45 发送悄悄话 M45 的博客首页 (169 bytes) () 06/21/2018 postreply 16:46:10

咱俩合伙开赌场吧. 还有四年的准备和筹资的时间. -M45- 给 M45 发送悄悄话 M45 的博客首页 (169 bytes) () 06/21/2018 postreply 16:41:38

大师紧跟时代,值得学习。 -a7a8- 给 a7a8 发送悄悄话 a7a8 的博客首页 (0 bytes) () 06/21/2018 postreply 13:16:38

能源玩不起, 材料早已放弃了. 现在只能玩玩信息了. -M45- 给 M45 发送悄悄话 M45 的博客首页 (163 bytes) () 06/21/2018 postreply 16:43:50

能赚钱吗? -石假装- 给 石假装 发送悄悄话 石假装 的博客首页 (0 bytes) () 06/21/2018 postreply 22:34:41

能啊。你可以研发日文版的小帅。 -M45- 给 M45 发送悄悄话 M45 的博客首页 (0 bytes) () 06/22/2018 postreply 00:03:56

请您先登陆,再发跟帖!