Twitter最新资讯--twitter加粉丝网站
圆红豆 丽翔 凹非寺
物理位 报导 | 社会公众号 QbitAI
一头表情符号辨识AI,什么样才算得上 (优) 秀啊?
时不时地转换坐姿,都能动态输入Emoji,约是很秀了:
是把守 (误) ,是源自《星舰旅途》昂蒂的军乐。并不大常见,做出来即使有技术难度。
是好运气,通常会三只手一同比。但是,也并非人类文明通用型的表情符号。
即使这种,AI仍然机敏地辨识出。因此,它是在应用流程上跑,也基本上没延迟时间。
AI的妈妈,英文名字叫Nick Bourdakos (全称亚历克斯) ,是源自IBM的流程猿。
亚历克斯把他们的调校丰硕成果发了twitter,揽下2.8万赞:
△ 666
亚历克斯用的是TensorFlow.js,动态辨识毫无压力。
他把算法开源了,说大家都可以试一试。
半小时就好
亚历克斯说这个模型很简单,就是SSD-MobileNet。
MobileNet是分类,SSD是目标检测,搭配食用也是常规方法。
他是用IBM云上的GPU训练的,免费的k80,半小时就训练好了。
在训练开始之前,要先准备数据:AI吃的是标注过的表情符号图。
准备就绪,就来安装模型吧:
1$ npm install -g cloud-annotations
然后,可以开始训练了:
1$ cacli 2┌─────────────────────────────┐ 3│ (C)loud (A)nnotations (CLI) │ 4│ version 1.0.12 │ 5└─────────────────────────────┘ 6 7Usage: cacli8 9where is one of: 10 init Interactively create a config.yaml file 11 train Start a training run 12 logs Monitor the logs of a training run 13 progress Monitor the progress of a training run 14 list List all training runs 15 download Download a trained model 16 17cacli -h quick help on
当然,也并非非要用IBM云,也并非非要用GPU。拿CPU也能调校AI,大概要几小时吧。
训练完成,该在应用流程上跑了。GitHub项目里,自带了转换为TensorFlow.js模型的脚本。
把模型添加到React App里面。
最后,写一句nmp start,用应用流程打开http://localhost:3000。
耶,这种就可以对着屏幕随意舞动手指了,你的AI会明白的:
当然,这只机敏的AI,才并非只能辨识手指。
喝点什么
只看你用什么样的数据去投喂AI了。
曾经,亚历克斯就帮AI修炼了分辨汽水的眼力。
第一题:一瓶雪碧,一瓶Canada Dry,都是绿色。
不管调换位置、还是侧过瓶身,AI都不会被迷惑。定格一看:
第二题:加大技术难度,两瓶都是Mountain Dew,一瓶普通一瓶低糖。
AI仍然分得清楚,毫不犹豫。
分辨表情符号,分辨汽水,都不失水准。
那么问题来了,你想让AI辨识什么呢?
想好了就开始调校吧,代码在这里:
https://github.com/cloud-annotations/training/
P.S. twitter评论区,已经有小伙伴亲测成功,并表示Easy。
△ 再把辨识结果,显示成Emoji就完美了
—完—
诚挚招聘
物理位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在物理位社会公众号(QbitAI)对话界面,回复招聘两个字。
物理位 QbitAI · 头条号签约作者
վᴗ ի 追踪AI技术和产品新动态