种合作关系是非常自然的并且将我们引向
是否仍然可以使用这些请求的数据来训练你的模型?: 不即使现在对于我们的用户和客户我们也不会在未经特别允许的情况下使用他们的数据来训练我们的模型。因此这方面的规定是明确的。 主持人: 那么当你与像这样重视声誉的公司打交道时他们认为重要的一些问题是什么?因为其中一个问题是关于这些信息的去向和用途的担忧。: 我认为这是一个非常一致的合作伙伴关系。隐私和信任是关键对于的使命来说确保我们构建和部署的技术让人们感到信任和有参与感是非常重要的。 因此这我们希望前进的方向。关于假信息的问 电话号码数据 题这显然是非常复杂的因为我们正在建立在数十年的假信息之上并且随着的发展这种情况变得更加严重。然而互联网和社交媒体也产生了复合效应。 在某种程度上正好把这一切推到了风口浪尖让这个问题受到更多的关注和审查。这是一件好事因为它似乎促使大家共同努力解决这个问题。我认为这将是一个逐步的过程我们将随着时间的推移进行尝试和调整。 主持人: 我知道与合作不能出错因为如果出现问题他们会让你陷入困境。我很好奇这次合作是如何开始的?是从和之间的对话开始的吗?还是你也参与了?: 其实我不太记得它是从哪里开始的但已经酝酿了一段时间。 主持人: 已经有一段时间了。你也在与其他公司进行类似的合作谈判。显然你与微软有关系。播客听众她对我笑了。我不会透露更多了我们继续。
已经与新闻集团和 等公司达成了内容许可协议这样就减少了潜在的诉讼问题。如果我是你我可能不会考虑这种合作。 那么你如何说服我许可我的信息?鲁珀特·默多克已经盗用了我的其他信息《纽约时报》也是我不希望再有其他人包括你。: 我知道你对此很关心所以我可以告诉你我们如何看待数据训练模型的问题。我们主要有三个数据来源:公开数据、与出版商的合作数据以及我们支付人力标注的特定数据。 此外我们还有用户自愿允许我们使用的数据。关于出版商合作我们关心的是信息的准确性用户也非常重视这一点。 因此我们与特定产品建立了一对一的合作关系提供对用户有价值的信息同时也在探索不同的方式来补偿内容创作者让他们的
数据在产品中展示或用于训练。 主持人: 有些人会与你合作像和许多其他机构但有些人则会提起诉讼比如《纽约时报》。这如何演变到那一步?: 我不能具体评论这些诉讼但这确实很不幸。因为我们认为在产品中拥有新闻数据和这种类型的信息是有价值的因此我们尝试与他们达成合作但在这种情况下未能成功。 主持人: 或许未来会成功。我想这是因为媒体多年来与互联网公司打交道通常最终会吃亏。但每期节目我们都会请专家提问我们来听听你的问题。 观众: 。我是斯坦福大学计算机科学教授也是斯坦福人类中心研究所的联合创始人。我想问你一个关于数据的问题。很多人认为的成功与数据密切相关。我们了解到你的公司从互联网和其他来源获得了大量数据。 那么你认为数据与模型之间的关系是什么?是否简单地认为输入的数据越多模型就越强大?还是需要花费大量时间来整理不同类型的数据以使模型有效?最后你如何解决对大量人类生成数据的需求与这些数据的所有权和权利问题?: 关于数据和模型之间的关系这其实是很多人对模型特别是大型语言模型的误解。开发这些模型的人
頁:
[1]