身为法师的我只想追求真理

第三百七十章 M语言和最先被干掉的职业

天才一秒记住本站地址:[笔趣阁]
https://m.bqgok.net最快更新!无广告!

(本章未完,请点击下一页继续阅读)第三百七十章M语言和最先被干掉的职业(第2/2页)

“大家这段时间唯一的工作,就是把M语言以及M框架和配套的这一系列包,学会怎么用。

然后结合我们的工作,看有哪些地方可以利用M语言来进行重写的。”

其中最先被利用到的就是AI鉴黄。

AI鉴黄一直都是内容安全的核心诉求,基本上从猪厂、鹅厂到微博、字节,全部都在研究这玩意。

属于经典的入门容易精通难。

早期的鉴黄基本上是人工审核,属于劳动密集型工种。

后来上网人数多了,内容也多了,人工审核成本越来越高,因此采用AI+人工的方式鉴黄就成为了主流。

AI+人工的方式一般是先通过机器过滤出大部分一定正常和一定有问题的图像,剩下的再交给人工进行审核,这样可以大幅度降低人力成本,而且机器识别效果越好,人工审核成本越低。

AI鉴黄其实是比较宽泛的概念,可以是通过规则系统来实现,比如基于MD5、基于用户的IP等信息设置黑名单库,直接基于规则进行拦截。

大部分还是会采用算法模型,也就是用算法模型判断一张图像中是否包含sq信息,本质上就是图像识别。

图像识别目前在部分任务上的效果甚至超越了人类。

图像识别中最常见的就是图像分类算法,从Alex到VGG,从Res。

目前的图像分类算法可以较为准确地区分Image的1000类数据,鉴黄本身也是对输入图像做分类,因此采用图像分类算法就是顺其自然的事。

而且目标检测算法可以用来检测sq图像中的露点部位,也是比较可靠的手段。

此外,还有基于业务层面构造的特征和逻辑,比如是否有人、皮肤的面积等,用来辅助判断,在一些情况下确实是有效的。

AI鉴黄的难点主要在于不露点的软sq,特征小的sq、非通用sq以及卡通动漫sq等等。

这是图片ai鉴黄的难点,视频和音频鉴黄的难点就更多了。

而且对于这帮互联网大厂来说,即便能够做到百分之九十九的拦截率,剩下百分之一的内容都不得了。

以微博为例,每天产生的数据都是以T为单位。

即便是几十个T,百分之一的拦截失误率,都足够把来总整的够呛。

而且更重要的是华国的内容审核行业,不仅仅局限于鉴黄,OCR审查这帮互联网大厂更是很早就在做了。

点到为止。

同样的道理,百分之九十九的拦截率,对他们来说都是无法接接受的。

所以一直到了2031年,依然是AI加人工的鉴黄方式。

只是说2021年的时候像微博这个体量的,可能需要上千名鉴黄师,到了2031年只需要上百名。

四位数变三位数。

至于微信,你在一遍,然后丢到后端的审查接口。

通过权重算法来判断你是否有违规行为,触发特定规则之后,会决定你倾向的权重,权重超过阈值之后你会被重点关注。

将会有人工来对你进行审核。

当然这种审核不仅仅是国内的大厂,fb、ins、youtube、Google和推特都有大量的人工审核团队。

他们的审核团队放在菲律宾。

在2018年的时候,关于这件事,PBS放过一个纪录片。

对于国内外的互联网巨头们来说,他们在文字识别上能够做到接近百分之百,但是在图像分类测试中,只能做到98%左右。

而且对算力有非常高的要求,压根用不到实际的生产环境里。

这是Image每年的图像分类测试竞赛结果,实际运营中的图像视频识别比Image竞赛可要难得多。

而郑理公开的AI算法后,利用M语言写出来的模型。

从部署到使用突破了这帮互联网公司的认知,一个能够对内容实现99.9的识别成功率的AI模型,需要花的算力和之前差不多。

也就是说之前互联网大厂们几百人的AI鉴黄规模,现在再度被压缩了百分之九十。

AI鉴黄只是M语言最先落地的应用。

它代表的AI技术,在算力优势以及算法本身的落地难度都大幅度提升。

它允许轻松构建大部分原本复杂的架构,能够广泛的应用在工业领域。

大量易于组合的模块化部件,编写自己的图层类型、计算图抽象、数据和模型并行、动态类型的稳定性等等都完美适配。

在算法工程师们使用之后,Github上M语言相关的项目成为社区热门。

国外的程序员社区里,活跃的大牛都在吐槽,一些很少发言的大牛也冒泡了:

“梅林的技术远超我们的想象,如果M语言是他自己开发的,那他在AI领域的造诣要超过我们所有人。

真的很难见到一款没有任何缺陷的AI编程语言。

像Caffe能够把Matlab的快速卷积网络实现移植到C和C++,适用于前馈网络和图像处理,不需要任何代码就可以训练模型。

但是caffe不能使用于循环网络,同时扩展性极差。

谷歌推出的TensorFlow框架能够生成计算图之后执行自动微分,不需要在尝试新的神经网络排列的时候,手动去进行编码。

但是它运行速度很慢,同时在大型的软件项目里非常容易报错。

基本上这些年各大互联网巨头们推出的AI框架,或多或少都会存在问题。

当然这是无法避免的,没有什么东西能够完美。

就像Java使用的人再多,活跃的时间再长,也是能够找到缺点的。

但是M语言在人工智能领域,就好像没有缺点一样。

好像经过了无数次的测试和优化,达到了一种圆满。

这让我严重怀疑,梅林掌握的人工智能是强人工智能。

他能够实现几乎蓝星人对于人工智能的所有幻想。

包括自我编程。

一段代码能够编译另一段代码,好像也不是那么稀奇。

毕竟现在的人工智能模型已经可以自己进行简单的编程了。”

🅑  Q  ⓖ  𝒪  𝑲. n  e  t

人气小说推荐More+

天焱皇朝苏铭渊
天焱皇朝苏铭渊
三年前,他成了家族唯一的希望,却在关键之时觉醒至尊血脉,无比痛苦,以至于错失比赛,家族没落。他,成了家族的罪人。三年后,他狼狈归来,受尽白眼,就连他的父亲都不原谅他……没了辉煌的家族,要这血脉何用?畏手畏脚,不敢施展,要这天赋有何用?为了证明自己,也为了再给家族争一线生机,他提起那柄剑,誓要横扫九天八荒!
佚名
四合院:开局截胡秦淮茹,震惊全院
四合院:开局截胡秦淮茹,震惊全院
穿越到战争年代,好在爷爷是个小郎中,医者的身份让他免于战争之苦。他一直和爷爷学习医理,直到五一年,才迎来生活转机……是的,他遇到熟人了!原来这里是《四合院》的影视平行世界,与此同时,系统也苏醒了!面对激活系统的截胡任务,他再次陷入沉思……怎么滴!还要截胡一个女人?娄晓娥,秦淮茹,冉老师,这该如何选择呢!
佚名
保姆是你白月光,我嫁京圈太子你哭啥
保姆是你白月光,我嫁京圈太子你哭啥
池薇和严景衡是圈子里出了名的模范夫妻。池薇一直以为,严景衡是爱她的。直到保姆的丈夫意外去世,他把保姆母女接到家里照顾,池薇才意识到,原来他对她的好,从始至终都是一场精心的算计。就连她的…
露将熹
一手掌生死,一剑断万古苏铭渊天焱皇朝
一手掌生死,一剑断万古苏铭渊天焱皇朝
三年前,他成了家族唯一的希望,却在关键之时觉醒至尊血脉,无比痛苦,以至于错失比赛,家族没落。他,成了家族的罪人。三年后,他狼狈归来,受尽白眼,就连他的父亲都不原谅他……没了辉煌的家族,要这血脉何用?畏手畏脚,不敢施展,要这天赋有何用?为了证明自己,也为了再给家族争一线生机,他提起那柄剑,誓要横扫九天八荒!
佚名
(综漫同人)一觉醒来香克斯又在挨打
(综漫同人)一觉醒来香克斯又在挨打
收藏数:19780提前排雷:1.部分为跟上一本番外的原文修改版,所以前几章会是我抄我自己。2.虽然文名里有香克斯,但出场靠后点,且重点为白团。——白胡子海贼团的男人们做梦也没想过能在大海上捡个孩子。她看起来好..
飞天小叽一号