ChatGPT,遭到了一波反向收费。
而管 OpenAI 要钱的,正是全球最大程序员问答网站StackOverflow。
(资料图)
理由是这样的:
你们拿我家的数据去训练 AI 了。
无独有偶,在 StackOverflow 之前,Reddit近日也发出了类似的信号——计划开始向访问其 API 的公司收费。Reddit 老板给出的理由更是直白:
我们的数据非常有价值,不想免费提供给科技巨头们。
不得不说,这波围绕类 ChatGPT 展开的 " 商战 " 着实有点意思。不过围观的网友们就不那么乐观了:
唯一没有获利的……好像就是用户了。
科技巨头们要为训练数据买单了我们都知道,训练一个像诸如 ChatGPT 这样的 AI,背后定然需要海量的数据。
无论是 OpenAI、谷歌、微软、Meta 或是其它公司都是如此。
但这些科技巨头们一般获取这些数据的方式都是从网上抓取,也因此不会给对应数据背后的公司掏钱。
他们所获取的数据来源,就包括了 StackOverflow、Reddit 在内的数千个在线 " 资源 "。
然后科技巨头们就会将这些数据 " 喂 " 给大模型,让对话 AI 变得更聪明、更智能。
待产品们成熟可以 " 上岗 " 之后,科技巨头们就会开启付费模式,例如我们熟知的 ChatGPT Plus、GitHub Copilot 等等。
但在这么一个过程中,像 StackOverflow 和 Reddit 这样的网站,就有点惨了。首先,就是我们刚才提到的,这些 AI 拿着他们家的数据做训练,变得更强更优秀。
其次,这些 AI 的诞生似乎对于它们来说并没有太大的益处,反倒可能会变成非常有竞争力的对手。
于是乎,Reddit 就率先不干了,CEO Steve Huffman 直接撂下狠话:
想白嫖,没门!得交钱。
而后 StackOverflow 的 CEO Prashanth Chandrasekar 也公开赞成 Reddit 的做法。
不仅如此,他还认为这些大语言模型(LLM)的开发人员还违反了自家网站用户们的权益。
因为在 StackOverflow 条款中有这样的明确规定:
用户拥有他们在 Stack Overflow 上发布内容的所有权,但所有内容均受知识共享许可的约束,该许可要求以后使用这些数据的任何人都说明其来源。
Chandrasekar 认为,日后科技巨头们拿着自家的类 ChatGPT 的产品去出售的时候,开发人员是解释不清用了 StackOverflow 哪些用户的问答去训练的模型:
因此,他们违反了知识共享许可。
据了解,StackOverflow 和 Reddit 目前都没有对数据收费做明确的公示,而且价格也没有定下来。但另一方面,各种大语言模型背后的企业,也正在努力降低开发的成本。
将来若是训练数据都要收费了……那这部分成本又将会有谁来买单呢?
反正 Reddit CEO 的表态是:
爬取 Reddit 数据产生了价值,却不将任何价值返还给我们的用户,这是个问题。
会怎么收费?
虽然目前 StackOverflow 和 Reddit 都没有明确训练数据的价格,但有媒体猜测,他们可能会借鉴马斯克推特的 " 定价路线 "。
例如在这个月,马斯克就提高了访问推特数据的价格—— 42000 美元 /5000 万条推文。
更戏剧性的是,马斯克前一阵子还以 "OpenAI 非法使用推特数据训练 " 为由,准备起诉 OpenAI。
而不仅是文字领域,在图片生成领域,因训练数据而产生的纠纷也是屡见不鲜。例如 Getty Image 就在此前起诉了 OpenAI 的对手 Stability AI。
理由是涉嫌使用超过 1200 万张照片且之前没有寻求过许可。
……
至于像 StackOverflow 和 Reddit 最终将如何定价,还需要等待他们官方的表态。
但值得明确的一点是,随着这一波 AIGC 热潮的到来,其背后的各种 " 规矩 ",是值得深入探讨、商定了。
参考链接:
[ 1 ] https://www.wired.com/story/stack-overflow-will-charge-ai-giants-for-training-data/
[ 2 ] https://qz.com/reddit-ai-bots-training-payment-1850352526
[ 3 ] https://twitter.com/ruchowdh/status/1649168431063736320
关键词:
-
交钱!StackOverflow:类 ChatGPT 们用我数据训练得付费_动态
ChatGPT,遭到了一波反向收费。而管OpenAI要钱的,正是全球最大程序员问答网站StackOverflow。理由是这样的
-
今日看点:三国杀廖化强度_三国杀 廖化
1、界廖化的强度被大多数认为是英姿双刀,不怕乐,以及还有一个不错的回血防御技,而我们的张翼虽然被小小
-
出自韩非子的寓言故事成语_出自韩非子的寓言故事
1、韩非子》书中记载了大量脍炙人口的寓言故事,最著名的有“自相矛盾”、“守株待兔”、“讳疾忌医”、“
-
世界观察:大元泵业:2022年净利同比增77.12% 拟10派7元
大元泵业(603757)4月23日晚间披露年报,2022年实现营业收入为16 78亿元,同比增长13 05%;净利润2
-
重点聚焦!剩者为王:金螳螂拐点或至
随着行业需求回暖及供给端出清,行业龙头拐点或已显现。 薛宇 文 建筑装饰行业龙头金螳螂(002081 SZ
-
世界热点!博科测试过会,上市前夕实控人之一去世,贡献3成收入的客户同时还是供应商
博科测试过会,上市前夕实控人之一去世,贡献3成收入的客户同时还是供应商
-
27.38万元起售 魏牌蓝山以高价值体验 让产品回归第一性
【2023年4月22日】魏牌新旗舰——蓝山DHT-PHEV(以下简称“蓝山”),以“共享大好时光”为主题的蓝山上市发布会
-
天融信:2022年营收35.43亿元 数据安全业务表现亮眼
中证网讯(王珞)天融信(002212)4月21日发布2022年年度报告。报告期内,天融信实现营业总收入35 43亿元,同比
-
保存象棋棋盘信息,需要多少比特?我只用139-167位二进制|今日最新
分析方案一:数组长度为32,每个数组项目是个uint8,总共8*32=256位。
-
【环球播资讯】康泰生物2022年营收31.57亿 董事长杜伟民薪酬339.48万
挖贝网4月23日,康泰生物(300601)近日发布2022年年度报告,报告期内公司实现营业收入3,157,401,754
-
康泰生物:2022年亏损1.33亿元-环球动态
康泰生物4月23日晚间披露年报,2022年实现营业收入31 57亿元,同比下降13 55%;净利润为亏损1 33亿元,上年
-
老师为什么要当老师_为什么要当老师
1、是自己从小的梦想2、把自己的知识和学生们分享。2、帮助到更多的人3、对待小朋友、学生很有耐心。3、也
-
全球微资讯!中超3队两连胜!9队未尝胜绩 浙江两连败!足协黑恶势力倒了 三镇却不凶了
前两轮,中超只有亚泰、上海双雄这3支球队两连胜,未尝胜绩的球队多达9支,他们是北京国安、河南队、南通支
-
当前热门:6at耐用还是8at耐用 在耐用上6at和8at的区别在哪?
首先6at更耐用一些。从结构方面来判断,6at变速器要比8at变速器更耐用一些。At变速箱主要是由两个部分组成
-
心脏干扰性脱节
1、心脏干扰性脱节:假若心脏中存在着两个节律点。2、并行地各自发出激动。3、在一系列的心搏中产生相互干
-
牢狱蛇姬完整版第一部_蛇姬海军牢狱h3部_环球热闻
1、bt搜索3D蛇姬(现在搜到的都是分上下部分的)、监狱蛇姬(还是蛇姬监狱来着)都试下呗。本文到此分享完
-
购车最高可省4000元!平谷发放新一轮消费券
购车最高可省4000元!平谷发放新一轮消费券
-
焦点消息!紫云自治县第三中学正式挂牌成立
紫云县委教育工委专职副书记、县教育和科技局党组书记、局长周文科出席揭牌仪式并讲话。4月21日,春光明媚
-
天天速看:融资丨「中科宇航」完成6亿元C轮融资
创业邦获悉,广州中科宇航探索技术有限公司(以下简称“中科宇航”)完成6亿元人民币C轮融资,由广州产投集
-
俄媒:中国经济让一厢情愿的西方专家的悲观预测落空
“今日俄罗斯”电视台4月21日文章,原题:中国经济让一厢情愿的西方专家的悲观预测落空今年一季度中国经济