人工智能营销：机器失败的地方

正如第1章所提到的那样，有些认真的人非常担心会释放出世界上的艺术情报。没有尝试是由这里来解决的大问题

围绕我们的计算机霸主的潜在到来。这里有足够的考虑让你向前迈进，因为你没有引起笔记本电脑的全面毁灭，并且你准备与那些尚未有机会消化可能性的人讨论这些问题。

我们开始认识到AI是一个简单的工具，一个复杂的和被误解的工具，但能的没有什么更比我们允许它完成。

一个锤子不是一个卡车司机

与其他形式的分析一样，AI是一种有用的工具，但不是决策的替代品。从学术界，文学作品和电影中记住以下引用。

永久收集，分析和存储数据的能力创造了一个与思维如何进化以应对日常生活形成鲜明对比的世界。忘记（和回忆）本质上是人的品质，并且在社会背景下可以说是必要的。帮助人们谈判

232

233

在数字世界中，我们需要发明能够以有用的方式模仿我们如何作为人类运作的算法。

迈克尔・拉帕，博士，晚安主任的该研究所的高级分析和杰出的大学
教授
北
卡罗来纳州
州立
大学

我认为，世界上最仁慈的事情是人类思维无法将其所有内容联系起来。我们生活在一个平静的无知岛屿上，在无与伦比的黑海中，这并不意味着我们应该远航。每个科学都朝着自己的方向发展，迄今为止对我们的伤害很小; 但某一天拼凑在一起游离知识将开辟这种可怕的前景的现实，和的我们的可怕位置在其中，我们既要发疯的启示或FL EE从光成的和平与安全新

黑暗时代。

Cthulhu的召唤，HP Lovecraft

侦探德尔斯普纳：

卡车把我们的车撞在一起，把我们推到了河里。你知道，金属在那些速度下变得非常柔韧。她寄托，我寄托，对水的进来。我是一个警察，所以我知道每个人的死亡。只是一个少数分钟，直到我们科幻古尔说出来。NS4经过并在河里跳了起来。

苏珊・卡尔文：

机器人的大脑是一个差异引擎。它正在阅读生命体征。一定是……

侦探德尔斯普纳：

它做了。我是合乎逻辑的选择。据计算，我有45％的生存机会。莎拉只有11％的几率。那是某人的宝贝。11％绰绰有余。

人类会知道这一点。机器人，[表明他的心]在这里什么也没有，只是灯光和发条。来吧，你相信如果你愿意的话。

我，机器人（电影），基于艾萨克・阿西莫夫的书

234

各种自动化系统都会出错。人们犯了错误。这就是如何我们学习。AI 可以学习和这就是为什么我们要能够得到多做这么多，越好，用更少的失误各一次SPECI音响空调系统的正常训练。

目标 – 警示故事

在大数据泡沫的高峰期（2012年2月），“纽约时报”发表了一篇关于Target及其宏观，预测性分析失误的文章1
。这是简短的版本。

Target 发送了一些装满婴儿用品的直邮邮件给那些曾告诉过他们期待的女性，以及那些像自我报告女性一样行动的女性。一位愤怒的父亲打电话给商店经理抱怨他16岁的女儿收到了一个，他不喜欢它。商店经理致电总部，了解这是如何发生的，并了解了分析项目。在回到父亲的电话后，经理被告知这个女孩确实带着孩子。

耸人听闻的版本是老大哥对你的了解太多
了。隐私问题引发了很多噪音。该时报的文章，随后进行到底，然而，要发现目标已经吸取了教训，并改变了它的方式。

市场营销部门通过
从列表中选择一小部分女性随机样本进行了一些测试，并将这些广告组合邮寄给他们以了解他们的反应。

“我们有能力向每位客户发送一本专门为他们设计的广告手册，上面写着：‘这是您上周购买的所有商品和优惠券

对于它，” 一个目标高管告诉（ 新的纽约时报
记者查尔斯 Duhigg）。“我们做的是对食品产品的所有

的时间。” 但是，对于怀孕妇女，目标公司的目标是卖他们的婴儿的物品，他们不甚至知道他们需要呢。

“ 尽管怀孕产品，我们了解到一些女性的反应很糟糕，”这位高管表示。“然后我们开始在所有这些广告中混合我们认为
孕妇永远不会购买的东西，因此婴儿广告看起来是随机的。我们在尿布旁边放了一台割草机广告。我们在婴儿服装旁边放了一张酒杯优惠券。这种方式，它看起来像所有的产品被选择的机会。而我们发现只要怀孕了

235

女人认为她没有被监视，她会使用优惠券。她只是假设她街区的其他人都有尿布和婴儿床的同一邮件。只要我们不惹她，就行不通。“

活到老，学到老。

人工智能是一样的。它可以无用地使用。它可以不经意地使用。

它可以毫无意义地使用。但它可以学习。

机器错误

机器会犯下我们允许的错误。人类可能是懒惰，不专心，恶意和错误的。所有这些都将使我们的创作成为我们的弱点。然而，一台机器最简单的方法，以使一个 “错误的判断” 是，如果它做出好的基于错误数据做出决策。

数据很难

在 宇宙中 是 模拟的，凌乱的，复杂的和受到 许多 解释。

大卫温伯格

营销数据很乱

好旧的结构化数据库是一团糟。CRM数据是由尽力而为但遭受拼写错误，缺乏关注以及仅关注影响它们的数据的人输入的。换句话说，他们只是人类。

那是结构化数据。非结构化的东西非常混乱。

如果你想要一台机器识别猫，你可以给它很多的照片和一些线索（监督学习）。但是，各种各样的照片都是静态的，有限的。如果图片中有一只猫在文件中，那么机器需要确定的一切。

如果你是在教一台机器玩视频游戏，一切机器需要到知道是上了屏幕。 “在雅达利的游戏是非常的COM折襞，”马特说Gershoff。“你有框架和像素，你想要为它控制一个控制器，对吗？而这是非常compli- cated。你有这样的非常高维空间，并且像素在某些意义上相关的有一个另一个。你不能真正看在一个像素中的隔离。这是高维的，但它是所有有。。。不像营销问题。“

236

市场营销
是做了的更多信息，比我们能够编目。影响购买的因素是无数的。从唯一来源捕获此数据需要输出唯一数据类型的独特方法。从这些不同的系统中的数据必须被带到一起，痛苦，并且因此远，手动，通过一个方法被称为ETL。

提取，转换，加载（ETL）

将客户的结构化数据整合在一起始终是一项挑战，因为所有这些系统都以不同的方式和不同的属性存储数据。识别广告网络数据数据库中的个人是否有用，但将它们与销售人员自动化系统，客户关系管理系统，计费系统，呼叫中心系统以及从外部购买的随机数据集中的潜在客户ID相关联该组织需要一些繁重的工作。

流式/时间序列数据增加了独特的复杂性。一组数据开始在其周周日，接下来的周一。他们都是从午夜开始，但你必须记得询问 – 在哪个时区？将其称为简单的数据集成，数据整合或数据融合，使所有这些不同的数据类型能够很好地协同工作是我们长期以来必须面对的挑战。

在他的帖子， “该数据科学是动画处理艾米，” 2 X.AI
首席数据科学家马科斯・希门尼斯贝伦格尔哀叹的“硬劳动参与数据的科学。”

我们工作的一个（经常被忽视的）方面是准备分析数据。我们通常面临着

格式错误，标记错误或部分损坏的数据需要“清理”以进行分析。通过仔细研究，我们然后识别并推导出能够使机器抽象和学习模式的功能。从某种意义上说，我们正在描绘什么样的事情机器能够“看到”的数据，从该机器然后形成抽象，内部表示和模式，这个过程即是在我们的大脑形式有点类似于如何神经结构感官体验。我们经常遇到未解决和抽象问题的挑战，因为没有蓝皮书可以遵循。

公司像 AgilOne，多摩，和段被创建的库的管道来获得的数据来自已知源到一个德科幻奈德结构中的

237

商业数据仓库。这很有用，但“已知”，“定义”和“商业”都是奢侈品，而不是我们所有人都喜欢的。

这感觉就像一个商业机会，等待到发生。这，当然，是许多语句，将日期本书的一个没有时间。

Lithium Technologies的首席科学家Micahel Wu同意Belenguer的观点。“这很平凡。每个数据科学家基本上花费四十到百分之几的时间进行数据监控，而这实际上并没有为算法本身做出贡献。核心算法与按摩和清理数据无关。“

麻省理工学院/谷歌的报告“分析和机器学习如何帮助组织获得竞争优势” 3 指出，头号挑战是数据积累。

在大数据时代，第一个障碍是简单地收集，处理和存储不断增长的数据量 – 然后能够集成它。今天，消费者与品牌和公司在多个屏幕上，设备，触摸点，以及频道的互动方式，以及数据被创建与每个动作。“这是具有挑战性的，以将您的数据宇宙的控制，因为还有的这么多发生的事情，”
[Sagnik]南迪[在谷歌资深工程师]说。“有应用数据，客户调查信息，归因，广告。周围有数以百万计的数据浮出水面。“

当然，越来越多的数据来自移动设备。例如，智能手机上的Google搜索量比全球台式机和笔记本电脑上的搜索量要多。

像Alation这样的公司正在构建工具来按源索引数据，并创建一个数据目录，可以作为数据的推荐引擎。Paxata提供了一个自适应信息平台，它声称是“一个直观，可视化，自助服务的数据准备应用程序，通过点击而非代码收集，准备和发布数据，具有完整的治理和安全性，使用机器学习，自然语言处理和语义分析，实现数据集成，数据质量和数据标准化的自动化。“

认识到机器学习需要教师，“Tamr的机器驱动，人为指导的方法来准备所有客户数据以进行分析，这将使您能够在明显更快的时间内做出最佳的销售和营销决策。”

238

此外，“利用机器学习，Tamr可以轻松地利用整个数字供应链中的数百个数据源丰富内部数据 – 从iTunes到 Amazon.com，从RottenTomatoes到AllFlicks，从AMC到Fandango。”

众包数据规范化

Radius正致力于提供更全面的解决方案。在题为邮报“ARTI网络官方情报将决不转变业务流程除非我们首先解决CRM数据，” 4米半径的CEO达里安希拉兹介绍“给大家的好处科幻吨CRM数据财团利用机器学习，使数十亿美元的客户提供的感我们每天都有投入。“

在Dreamforce，我们宣布99％的客户提供来自他们自己的CRM的匿名和汇总数据，以改进我们的核心Radius Business Graph，这对我们所有的互联客户都有好处。随着我们不断获得更多贡献，所有客户都将受益于数据准确性和AI效率的指数级增长。这是我们计划扩展我们的集成以包括Microsoft Dynamics CRM，Adobe Audience Manager以及许多其他允许客户利用我们数据的真实性来推动真实情报和准确预测的原因之一

他们的事。

只有当基础数据准确而新鲜时，我们才能实现人工智能如何改变我们工作方式的愿景。利用网络效应，集成到公司使用的平台，并为CRM构建真正的联盟数据网络将使我们能够实现这一愿景。

这些是正确方向的步骤。

如此多的数据，如此少的信任

数据是一件很棒的事情 – 尤其是数字数据，因为它是二进制的。它可以是1或0，也可以是清晰的。虽然我们都愿意相信这是真的，但只有那些根本不了解数据的人才会相信它。

另一个营销数据更加困难的方面是它的不均匀性。交易是可靠的：在特定时间进行销售

239

给定的人以给定的价格。这一切都很稳固。另一方面，社交媒体情绪几乎是猜测。

只是按照订单

与宠物和儿童，我们有时会忘记那令人难以置信的智能机，我们正在努力与是不是智能的一些方法。机器
做什么，他们都告诉记者，
但只有什么，他们都告诉记者，而当不密切关注和培育的，它只是回形针所有的方式下跌。

本地最大值

“爬升为高的，你可以” 是的顺序和在盲目登山者把一个脚本办法和再是，直到他决定一个办法是多 “向上” 比其他。随着每一步，徒步旅行者变得更高。最后，没有更多，并且每一个可能的举动都会失败。该唯一的问题是，该登山者成功地
爬上了低山和没有的高山路旁边吧。

机器很乐意永远处理这些数字，很少考虑收益递减规律。他们只是保持曲柄，越来越小的结果。人类知道得更好。

对于尝试数百或数千个选项并将获奖者的元素融入新一代的基因AI系统尤其如此。“显性基因”获胜，最终所有后代看起来都很相似。

为了抵消这个缺点，AI系统必须考虑到多样性。正如多样性加强并改善解决问题的团队的结果一样，多样性必须融入人工智能系统，以奖励异常值并惩罚几乎与获胜者一样好但非常相似的算法。有些人倾向于将随机突变引入混合物中。如果成本很低，那么尝试很多疯狂的事情可能只会带来突破。

这使得我们牢记高级目标而不是让机器针对特定指标进行优化变得更加重要。

统计显着性

“学校里的每个人都要去，为什么我不能？！”“谁是大家？”

“苏西和麦迪逊以及艾玛和索菲亚！”

“你们班上的35个孩子中有哪些？那不是每个人。“

240

当互联网在20世纪90年代中期爆发时，它被认为是伟大的平等者。没人有网站。那些确实拥有可怕网站的人。任何人都可以使他们自己的网站，而最重要的是，只需要单击鼠标右键，查看源代码，复制，并粘贴到包括很酷的新功能，弹出在线。

但大卫只是成功地对抗歌利亚，直到歌利亚醒悟到可能性并开始为这个问题投钱。更大的预算，导致在更大的广告活动，更多的内容，更好的技术，更快的服务器，更好的服务。对不起，大卫。

目前，David还有另一个机会，因为AI背后的驱动力是我们可以访问的数据量以及将其与其他数据集相关联的独创性。如果您是一家只有少数客户且只有少数几个属性的小公司，那么人工智能将不会有所帮助。如果，但是，你能够从像Acxiom公司，百利，梅克尔，和Epsilon公司购买数据，并加入半径CRM财团，那么它只有创造力的问题和狡猾你带头。这也是一个问题的时间。

过度拟合

如果你做得恰到好处，那感觉就对了。当你得到它只是这样做的权利只是这个方式，你会想到，你必须做到这一点正好是这样每一次。但是，这就像指望那个蛋糕给来了同样的方式，即使温度，湿度，以及海拔已经改变。生活并非那么简单。

机器过度配置是一样的。它需要一个小的样品– 训练数据，并假设世界其他地方是完全相同这样。你的 AI系统期待噪声混合在与该信号一样，每次都如此。它记忆了一个特定的情况，而不是学习可以广泛应用的一般性。这是很容易做一个预测，如果要素和环境永远不会改变。

解决方案是交叉验证。支持数据的显着的块和比较的产生模式，以原。这是纯粹的科学方法，具有可重复的结果。

通过将数据随机分成训练集来测试过度训练，您将使用该训练集估计模型和验证集，您将使用该集验证模型预测的准确性。过度模型可能非常适合在训练集中进行预测，但通过在验证集中执行不良来提高警告标志。

241

您也可以考虑替代的叙述：是否有另一个 故事你可以告诉使用的 相同的 数据？ 如果是这样，你就无法确定你所发现的关系是正确的还是唯一的。

哈佛商业评论5

这是向机器教授科学方法的问题。每个新模型都成为“同行评审”的机制。

这些是直截了当的错误。人类更容易制造大佬。

人为的错误

Errare
humanum est。（错误是人类。）

所有的机器会做什么，他们会告诉和只哪些他们被告知。最坏的情况是回形针最大化。不太糟糕的情况也会发生。

意想不到的后果

青少年是忽视意外后果的最佳人选。他们的经验最少，并且由于前额皮质不发达而缺乏冲动控制。

在我们将前额叶皮层烘焙到人工智能系统之前，他们会毫不犹豫地执行命令而不考虑潜在的结果。这可能需要一些时间。在此之前，我们必须代表他们保持警惕。

如果我的妻子和我谈论我们的侄女亚历克西斯，那么响应唤醒词“亚力山”的亚马逊回声不能出现在同一个房间里。

响应唤醒词“亚力山”的亚马逊回声不能与圣地亚哥的新闻播音员收看的电视在同一个房间里讲述一个小女孩通过语音命令订购玩具屋的故事。这位新闻记者说，“我喜欢这个小女孩在黄金时段说‘Alexa 订购了一个玩具屋‘ 。” 房间里有Echos的家庭决定他们听到直接命令。订单得到了回应。

当一则广告为Google
Home扬声器播放时，更多人被调到2017年超级碗（近300万美元）。这则广告中包含了人们说“好吧，谷歌”这个唤醒短语

242

醒了谷歌主页系统全部超过了国家，转向上的灯光，转向了对音乐，并调整到的天气报告。

当Facebook试图将其新闻源排名转交给机器时，它出现了一些轻微的幽默错误（错误标记了一个可爱的狗视频，其中包含一个新的视频游戏的名称）以及推动趋势故事的不那么幽默的错误这是假的 – 并且发起了对 “假新闻” 的总统仇恨。

福克斯新闻主播Megyn
Kelly据称是希拉里克林顿的支持者，在一篇来自一个明显假新闻网站的文章中，结束了thefed.com。Facebook算法看到它呈现趋势并给予最高收费，从而使其他人相信这是真的，重新创造了欺骗的循环。

贾斯汀Osofsky， Facebook的副总裁全球歌剧系统蒸发散，公开道歉，并以上述华盛顿邮报，“我们正在努力使我们的骗局和讽刺故事，更快，更准确的检测。” 它会采取一些认真的努力来教
机器识别讽刺，恶意意图和过滤泡沫的影响。

Alphabet正在接受挑战。其公司Jigsaw于2017年2月推出了Perspective，以识别在线发布的有毒评论，以便它们可以被阻止。透视与成千上万训练有素的评论评为 “有毒” 的人，在该 新的纽约时报 谁允许他们出现在他们面前的每一天都有成千上万的评论文章。

通过自动化可能产生的影响进行思考是情景分析的内容 – 大量替代世界的头脑风暴。

优化错误的东西

什么没有一个回形针最大化看起来就像在该领域的广告，营销和销售？如果您优化和激励的数量冷呼叫您的销售团队可以使，他们会做出一个很大更多的电话。他们不会打出有价值的电话。如果您针对客户服务代表在呼叫中心接听的电话数量进行了优化，那么他们将非常简短地与客户进行简短的沟通。

机器也是如此。如果您想提高转化率，机器将停止投放支持品牌推广的广告，从而确保只有那些已经倾向于购买的人才会出现。如果你问的机器，以优化对顶线收入，它会

243

即使公司迅速倒闭，也要以50美分的价格出售1美元的账单并被视为成功。

Facebook的一个算法创建了“这是你的一年，为什么不分享它？”蒙太奇并向所有人抨击它。这包括一名女儿，她的女儿最近的死亡仍然是一个开放的伤口。Facebook一直在努力防止再次发生这种粗鲁的错误。

在一个网络
世界
的文章被称为 “Facebook的认可希望你到停止让自己的傻瓜，” 6个马克・吉布斯假定：

因此，可以想象的认可做自己的事，找对方式，并测试参与的策略。如果不知道的人会认为它是检测人有事情，他们创建的类别，再FL学分只是再测试策略用于广告和拉闸广告骗子‘的科幻官方’ 合作伙伴的事情像侦探服务和间谍装备。当这些广告开始，以获得牵引的认可，没有真正了解的相关性，
将率策略的高度成功，并因此保留重新连接宁它。

必须实现具有可衡量成果的明确目标。

人工智能的道德

关于给机器过多控制的哲学问题是信任。你相信一个计算器给你的心病– 矩形的答案吗？的当然你做。难道你信任的迎面而来的司机留在他的车道？绝对。您是否相信一个极其复杂的系统，其内脏无法被理解以做出重要决定？

248

伦理考虑使用ARTI网络官方智慧和富于非常第一个一个来解决在营销是关于该数据本身。无论如何，你从哪里获得所有数据及其数据？

隐私

之间的电话窃听，使用视频摄像头在公共，并在以能力
看每个人的
电子邮件，在世界的注意力已经转向到隐私。对于在市场营销主管谁愿意来做出的最的的大部分数据，这要么是一个障碍或机会。

在IEEE的 “伦理上不结盟设计” 报告描述的隐私作为在数据方面的重要道德困境不对称。“我们的个人Infor公司， mation 从根本上通知的系统驱动的现代社会，但我们的数据更是一个资产给别人比它是我们的。”

该 ARTI网络官方情报和自治系统驱动算法经济（AI / AS）对我们的数据普遍接入，但我们仍然从收益，我们可以从我们得到的见解获得分离出的生活。

为了解决这一不对称的存在是一个根本需要的人，以德科幻NE，访问，并管理他们的个人数据来作为其唯一的策展人身份。

认识到这种担忧对于保持营销人员不会落入客户的错误方面以及法律的错误方面至关重要。在欧洲，通用数据保护条例的目的是为在公民和不为的公司。根据该 GDPR，任何一家公司在欧盟收集的数据必须：

■
向个人提供有关个人数据是否，在何处以及以何种目的进行处理的具体信息。

■
通知国家数据保护机构该数据的预期用途。

■
给个人要存储有关数据的完整副本他们在一个办法是让他们来给它到另一个奥尔加nization。

■
根据请求删除个人数据并停止跟踪。

■
保护他们正在处理的数据的安全性，并通知个人任何违规行为。

■
在系统设计中包含数据保护。

■
任命一个数据保护 网络的CER。

249

否则，他们将面临重要的影响。“组织可以在违反GDPR或2000万欧元的情况下获得高达全球年营业额的4％。” 8 关于合规成本甚至技术可行性的问题很多。有三种方法可以解决这个问题

营销观点。

1.
双重选择在 无处不在

如果你有一个引人注目的价值主张，人们会选择加入。为了方便起见，他们很乐意在所有设备上进行识别。亚马逊1-Click按钮就是证明，以及在Facebook上与朋友和家人进行交流的能力。

这种方法的缺点是期望，你会清楚， COM的plete和简洁的关于什么数据，你被收集并（在备存─ 荷兰国际集团与全球法规）为什么要收集它。作为完整的关于每个位如何以及为什么你收集够硬，但作为简洁明了的同时是自相矛盾。

动机是企业责任，企业文化和品牌。IEEE的“道德对齐设计”报告表明，“使个人能够策划自己的身份并管理数据使用的道德含义将成为组织的市场差异化。”这是隐私作为一种特征和竞争优势。

2.
忽略全体 事

假设猫从袋子里出来了。可用于重新识别人员的数据已经大量存在。

网上点击，社交媒体，智能手机应用程序和某些地区重刑，可穿戴设备和物联网之间，它不再是可以区分所有的的数据是被收集，购买，并随后得到的。其中一些是特定平台所特有的，其中一些已经被编译成一个不可穿透的索引，用于计算结果的方法是商业机密。

这将是该课题的大声疾呼
了多年，并在结果不会是什么数据被收集新的规定，但使用这些数据是否造成危害。立法行动而不是技术。

3.
做你的 律师告诉你的事

公司法律顾问会告诉您，在完成诉讼无可否认地说明忽视法律的后果之前，没有办法确定数据保护的投资回报。

250

跟随你的心

您是否以及多少投资于隐私很快就会成为一个财务或法律问题，并成为一个道德问题。在麻省理工学院
媒体实验室有一个引人入胜的网站叫做道德机9 ，你被要求做出决定提前约一个自主汽车面临着严峻的潜在结果的选择。

汽车在行人穿越道和人行道上看到行人，发现刹车失灵了。它可以击中并杀死人行横道或人行道上的人。它该怎么办？

场景提供了替代属性。在一些人中，人行横道上有更多人，而人行道上则更少。有时人行横道上有修女和人行道上有孩子。有时灯光与行人有关，有时则没有。你指引汽车杀人谁？（见图8.2）

图8.2中的第一个选择非常简单：杀死动物，而不是人。随后的决定变得更加困难。汽车应该杀死男人，女人，无家可归者，男性主管和两名孕妇吗？

虽然网络营销是没有生命和死亡，这是非常重要的。人工智能合作伙伴关系（“为人民和社会做出贡献”）已经发布了八项原则：10

1. 我们将努力确保人工智能技术受益，并为尽可能多的人提供支持。

2. 我们将教育和倾听公众的意见，积极吸引利益相关者，寻求他们对我们关注的反馈，告知他们我们的工作，并解决他们的问题。

3. 我们致力于开展关于人工智能的道德，社会，经济和法律影响的研究和对话。

4. 我们认为，人工智能研究和开发工作需要积极参与并对广泛的利益相关方负责。

5. 我们将从事与和具有代表性的利益相关方的商业社区，以帮助确保该域SPECI网络Ç关注和机会的理解和解决。

6. 我们将努力以最大限度的好处网络连接TS 和解决的AI技术的潜在挑战，通过：

a. 工作保护的隐私和安全的个人

b.
努力理解并尊重可能受人工智能进步影响的各方的利益

图8.2杀死红灯或猫和狗穿过果岭的孩子和弯曲的十字架？

251

252

c. 工作，以确保AI研究和工程的COM munities保持对社会负责，敏感，并在更广泛的直接与人工智能技术的FL uences潜在从事社会

d. 确保人工智能研究和技术稳健，可靠，值得信赖，并在安全约束下运行

e. 反对发展和使用会违反国际公约或人权AI技术的应用，
促进保障和
技术，是做
任何伤害

7. 为了解释技术，我们认为人工智能系统的运行对人们来说是可以理解和解释的。

8. 我们努力以创造一个文化的合作，信任，和AI科学家和工程师之间的开放性，以帮助我们更好地全部实现这些目标。

即使是最好的意图也可能被那些不那么慈善的人所颠覆。

故意操纵

当你将青少年不成熟和机器学习结合在一起时，灾难随之而来。微软发现这一点非常尴尬。天网于1997年8月4日上线，并且自我意识到了

8月29日凌晨2:14 。

微软的Twitter聊天机器人Tay于2016年3月23日上线，并且在96,000 条推文之后不得不在 16 小时内关闭。（见图8.3。）

Tay的创建是为了模拟一个19岁的美国女孩，同时学习如何通过经验说话。这种经历包括与4chan’s / pol /（政治上不正确）论坛的互动。/ pol / 的居民决定教授Tay的攻击性和煽动性，使她发出一些真正可怕，种族主义，厌恶女性和仇恨的信息。

微软正在与Zo.ai （@zochats）再次尝试。Zo的推文受到保护。“只有CON网络Rmed指信徒必须接入到@ zochats的推文和完整廓。点击的“关注” 按钮来发送一个后续请求“。

MSPoweruser描述这种新的尝试，为“本质上是一个岑sored 泰或一个英文变的微软中国聊天机器人Xiaoice。莫宁是在正常很好的交谈，例如，莫宁确实在推出初期，在它提出了一个“超简称性格测试” ，你如果你会，而学习在学校或学习的经验。

253

图8.3微软的Tay没有持续一天。

但是当你继续讨论像政治这样的话题时，Zo只会简单地回答： “人们在谈论政治时可以说一些可怕的事情，
所以我不讨论。” 11

该人在/ POL /中有乐趣在泰的代价，拖钓的最佳状态。但是如果意图比仅仅搞乱微软的实验更加险恶呢？营销专业人员努力说服人们购买。如果人工智能被用来说服人们投票怎么办？

特朗普收费？

社交媒体，虚假新闻，激烈竞争的选举和机器学习的结合是一个不需要匹配的粉末桶。声明中所做的王牌活动中使用AI发送了正确的消息，只是在适当的时间正确的个人per- suade他们投票特朗普，如果他们可能是概率如此倾斜或不投票给希拉里，如果算法推导它可能会影响行为。

咨询网络RM 剑桥的analytica 是说来已帮助挥洒特朗普选举，并在Brexit 投票为好，通过使用心理分析与海洋人格模型。

■
开放性（愿意尝试新事物）

■
责任心（秩序，习惯和计划与自愿）

■
外向性（你是多么的社交）

254

■
宜人（让别人领先于自己）

■
神经质（你担心多少）

“成千上万”对美国成年人的调查开始创建一个模型来预测美国其他成年人口的个性（迪士尼公主你是谁？你的星球大战角色是什么？你应该在哪个国家？退休？）。

在公开演讲12 在2016年协和峰会，凸轮桥的analytica的CEO亚历山大・尼克斯描述了他们如何使用行为的微目标来影响的共和党初选。鉴于第二修正案是一个热门话题，他们可以将他们的广告细分为人。关于枪支保护的消息将说服她，而关于枪支作为运动和家庭传统的信息会影响他。（见图8.4。）

根据Nix的说法，Cambridge Analytica针对每个人使用了4,000到5,000个数据点，并代表Ted Cruz优化了其消息传递。克鲁兹显然没有赢得小学，但特朗普接受了剑桥分析学院的决赛。

除了4,000到5,000个数据点之外，他们还可以从MyPersonality 13 应用程序访问数据，该应用程序充当心理测量机。（“我很容易恐慌”，“我与其他人相矛盾”）。用户可以注册分享他们的答案。

myPersonality是一个流行的Facebook应用程序，允许用户进行真正的心理测试，并允许我们记录（同意！）他们的心理和Facebook专业。目前，我们的数据库包含超过6,000,000个测试结果，以及超过4,000,000个个人Facebook专业版。我们的受访者来自不同的年龄组，背景和文化。他们非常积极地诚实和谨慎地回答，因为他们参与的唯一评价是对他们的结果的反馈。

在新的纽约时报上剑桥的analytica的文章要求投诽谤“数据公司说‘秘密调料’辅助特朗普; 许多嘲笑。“
14

十几名共和党顾问和前特朗普竞选助手，以及现任和前任剑桥员工，表示该公司利用个性专业的能力 – 尼克斯曾经称之为我们的秘密调料 – 被夸大了。

图8.4基于共和党初选中个性模型的微妙消息传递

255

256

其数据产品被考虑用于特朗普先生的关键性投票操作。但根据三名前特朗普竞选助手的说法，测试显示剑桥的数据和模型的效率略低于现有的共和党全国委员会制度。

在最近的一些公共场合，剑桥高管已经承认这一点。“我不想伤到你的心; 我们实际上并没有对特朗普的竞选活动做过任何心理分析，“剑桥产品负责人马特・奥兹科斯基（Matt Oczkowski）在去年12月由谷歌主办的一个选举小组中表示。

在撰写本文时，故事仍在展开，但可能性仍然很有趣。在Das
Magazin的一篇文章中，15
斯坦福大学商学院助理教授Michal Kosinski博士描述了建立模型，证明了

。。。根据用户平均68个Facebook“喜欢”的情况，可以预测他们的肤色（用

95 ％的准确度），他们的性方向（88 ％的准确率），以及它们的AF网络liation对民主党或共和党的党（85 ％）的。但它并没有止步于此。

情报，宗教信仰以及酒精，香烟和吸毒都可以确定。根据数据，甚至可以推断某人的父母是否离婚。

他们建模的强度可以通过它如何预测主题的答案来说明。Kosinski继续不断研究这些模型：不久之后，他能够比普通工作同事更好地评价一个人，仅仅基于10个Facebook“喜欢”。七十个“喜欢”足以超越一个人的朋友所知道的， 150他们的父母知道， 300“喜欢”他们的伴侣知道。更多“喜欢”甚至可以超越一个人认为他们对自己的了解。在Kosinski发布这些发现的那天，他接到了两个电话。诉讼和工作机会的威胁。两者都来自 Facebook。

在达斯 Magazin的文章进一步争辩说剑桥的analytica“划分了美国人口为32的性格类型，并专注于只是17个州，”发现了值得注意的是，特朗普活动支付剑桥的analytica超过500万$，而史蒂夫是班农董事会成员。

257

Kosinski ……已经进行了一系列测试，很快将会发布。最初的结果令人担忧：该研究通过展示营销人员在将产品和营销信息与消费者个性相匹配时，在Facebook上的真实广告活动中可以吸引多达63％的点击次数和多达1,400次转化次数来显示个性定位的有效性特点。他们通过展示推广产品或品牌的大多数Facebook页面受个性影响，并且可以基于单个Facebook页面准确定位大量消费者，进一步证明了个性定位的可扩展性。

这将是值得留意的结果的该调查由信息专员网络铈（ICO），在英国的隐私监督。英国和欧洲对隐私的规定比美国更严格，所以他们的结果应该证明是有益的。

意想不到的偏见

虽然我们必须警惕的是坏人坏的意图可能会弯曲AI 到他们的意志，我们必须也有对警卫说的系统，我们建立不巧妙地在佛罗里达州uenced 由我们自己无法识别的偏见，或者通过偏见存在于数据。

波士顿市发布了一个
用于报告坑洼的应用程序。好主意，只有那些能买得起智能手机的社区才能得到他们的坑洼。

在更恶劣的错误是那些认为仍被埋在该系统中，未被发现。如果贷款被批准的基础上的收入和收入是种族偏见，在批准的评价将有比赛烤成的数据。亚马逊被称为出了不提供他们当天送货服务中黑人社区。谷歌显示广告的高薪工作，以男性多于女性。无论机器使用什么数据

造成了这些不公平现象。

作为营销人员，我们有责任监控数据科学家。让他们完成自己的工作，但要确保他们的方法中包含偏差消除和检测技术。这对营销人员至关重要，因为错误的数据或错误的问题会阻碍您将商品和服务推广到新市场。当被问及“谁购买我们的产品？”或“客户的哪些专业代表最高的终身价值？”时，答案将是短视的，随后的广告活动将是自我限制的。