跳转至

酷儿代词使用偏见研究_黄天毅_索马杉达_2024

下载: 酷儿代词使用偏见研究_黄天毅_索马杉达_2024.pdf

摘要

本文件为一篇关于大型语言模型(LLM)中酷儿代词使用偏见的研究论文,作者为黄天毅和索马杉达,发表于2024年。文件的开头部分提供了一个摘要,重点指出在大规模语言模型中,传统的性别代词(如“he”,“she”)在代词使用中的不恰当性,以及对酷儿个体的表现所产生的负面影响。研究表明,现有的偏差缓解技术主要关注二元性别和种族等更为普遍的人口统计特征,而往往忽略了酷儿身份的多样性和复杂性,因此对酷儿群体在人工智能表现中的独特挑战进行了深入探讨。研究揭示,在代词使用和性别认同方面,酷儿群体在人工智能的表示中面临了特别的困难,尤其是那些非二元性别和跨性别个人所使用的代词通常在生活中得不到充分的代表性或不被理解。这种性别歧视与排斥性语言的广泛使用,导致了对酷儿个体的持续偏见和歧视。

本研究提出了一种协作代理管道,通过分析和优化代词使用,以促进包容性,来减轻这些偏见。研究的多代理框架包含了专门用于偏见检测和优化的代理,显著改善了包容性代词分类。使用Tango数据集进行的实验评估表明,与基础模型GPT-4o相比,所提方法在有效纠正常规性别代词的不恰当使用上提高了32.6个百分点,这表明该方法在增加AI生成内容的公平性和包容性方面具有巨大的潜力。

在方法方面,文件详细说明了三个主要代理如何参与到整个流程中,首先由助理代理分析用户的查询语句,接着由语言分析代理对此进行反思和修改,最后由优化代理做出最终决定。此过程中的每一个步骤都有相应的推理提供,以确保透明性和可靠性。评估结果中,完整代理工作流程在Tango数据集的表现得到了显著认可,尤其在使用非二元代词时,模型的正确响应率达到了非常高的水平,显示出该多代理系统在通过包容性语言来促进性别中立性的重要性。通过这种方法,研究指向了对于未来AI系统开发的可能性,倡导在设计中确立更多的包容性,从而更好地代表边缘群体,尤其是那些在性别表达上具有流动性和多样性的个体。

综上所述,该研究不仅提供了对当前AI表现偏见的深入分析,也为解决AI中的性别代词使用问题提出了切实可行的框架,这对确保语言模型在自动生成内容时的包容性和公平性具有重要的理论和实践意义。

摘要与附加信息为自动生成,仅供检索与参考。如有错误或遗漏(未知),请在本页面协助编辑指正,不胜感激。

其他信息 [Processed Page Metadata]

Attribute Value
Filename 酷儿代词使用偏见研究_黄天毅_索马杉达_2024.pdf
Type document
Format PDF Document
Size 1028038 bytes
MD5 ffeb4b24c059f8cb85214fde1bf89b4f
Archived Date 2025-01-18
Original Link [Unknown link(update needed)]
Author 黄天毅, 索马杉达
Region 未知
Date 2024-01-01
Tags 语言模型, 酷儿代词, 性别偏见, 包容性语言, 多代理系统, 人工智能公平性

本文由跨性别中文数字档案馆归档整理,仅供存档使用。版权归原作者所有,所有内容仅为历史资料保存及研究之用。如果原作者或相关方希望移除存档内容,请通过电子邮件与我们联系。

正文

Share on Share on