视频分享网站开发,免费的拓客软件有哪些,常用的网络编程技术,申请个人网站和企业官网有什么不同本文是LLM系列文章#xff0c;针对《Prevalence and prevention of large language model use in crowd work》的翻译。 众包工作中使用大型语言模型的流行率和预防 摘要1 研究1#xff1a;LLM使用的普遍率2 研究2#xff1a;LLM使用的预防3 讨论4 材料与方法 摘要
我们表…本文是LLM系列文章针对《Prevalence and prevention of large language model use in crowd work》的翻译。 众包工作中使用大型语言模型的流行率和预防 摘要1 研究1LLM使用的普遍率2 研究2LLM使用的预防3 讨论4 材料与方法 摘要
我们表明大型语言模型LLM的使用在众包工作者中很普遍有针对性的缓解策略可以显著减少但不能消除LLM的使用。在文本摘要任务中没有以任何方式指导工人使用LLMLLM使用的估计流行率约为30%但通过要求工人不要使用LLM和提高使用成本例如禁用复制粘贴LLM的使用率降低了约一半。二次分析进一步深入了解了LLM的使用及其预防LLM的应用产生了高质量但同质的反应这可能会损害与人类而不是模型行为有关的研究并降低用众包数据训练的未来模型。同时防止LLM的使用可能与获得高质量的响应不一致例如当要求员工不要使用LLM时摘要中包含的携带基本信息的关键词较少。我们的估计可能会随着LLM的受欢迎程度或功能的增加以及其使用规范的变化而变化。然而理解基于LLM的工具和用户的共同进化是保持众包研究有效性的关键我们在广泛采用之前提供了一个关键的基线。
1 研究1LLM使用的普遍率
2 研究2LLM使用的预防
3 讨论
4 材料与方法