中文ChatGPT的难题之一在于训练集不然训练出的都是杠精
• 阅读 0
各家公司不管真假不管规模,现在都在疯狂蹭chatGPT热点。
我相信也还是有不少公司是真正在展开研发攻坚的,想要做出中文版的chatGPT。
而chatGPT在英文方面变现非常好的原因之一是,英文是世界通用语言,语料库训练数据极其庞大。相比之下,中文没有那么流行,也没有很多网上流通的数据。OpenAI也不会对中文有很高的优先级。
所以,chatGPT的技术难点其实没有那么难以逾越。中国在人工智能方面的研究可以说是跟美国处在几乎同一水平,高水平论文也非常多。打造中文chatGPT的难点在于构建大量优质的中文训练集。
不信,可以看质量差的中文训练集训练出来的对话,很有贴吧风范。