我國(guó)近年來(lái)出臺(tái)了一系列支持女科技工作者的政策舉措。2021年,全國(guó)婦聯(lián)、科技部等制定了《關(guān)于實(shí)施科技創(chuàng)新巾幗行動(dòng)的意見(jiàn)》,之后又發(fā)布了《關(guān)于支持女性科技人才在科技創(chuàng)新中發(fā)揮更大作用的若干措施》;從2024年開(kāi)始,國(guó)家自然科學(xué)基金委員會(huì)將女性科研人員申請(qǐng)“杰青”的年齡限制由45周歲放寬到48周歲。
根據(jù)自己的工作經(jīng)歷和觀察,姚鴻勛教授看到女性在很多工作中與男性一樣表現(xiàn)突出,但機(jī)會(huì)不均等。在學(xué)校里,女生在學(xué)業(yè)方面往往表現(xiàn)很好,但在整個(gè)職業(yè)發(fā)展過(guò)程中,女性往往會(huì)遇到不公平對(duì)待。在工科教育中,也存在女生自認(rèn)為不如男生的情況,因此在教育過(guò)程中,教育者更應(yīng)該對(duì)女生進(jìn)行鼓勵(lì)和支持,增強(qiáng)女生的自信心。
比如,夏天辦公室里,女同胞經(jīng)常會(huì)抱怨空調(diào)開(kāi)得太冷,這是因?yàn)榕源x率比男性低35%;許多工具女性用起來(lái)不順手,這是因?yàn)榕缘钠骄樟Ρ饶行缘?1%……
訓(xùn)練AIGC需要巨量的數(shù)據(jù),數(shù)據(jù)量的不平衡,語(yǔ)料庫(kù)中發(fā)言者的性別帶來(lái)的性別偏差,都是讓AIGC在性別問(wèn)題上呈現(xiàn)偏見(jiàn)的原因。此外,在技術(shù)研發(fā)領(lǐng)域,女性仍少于男性。這會(huì)產(chǎn)生一些“無(wú)心之舉”。
九线拉王水果机棋牌下载大模型越來(lái)越聰明。OpenAI的GPT-4o,不僅“火眼金睛”能夠準(zhǔn)確識(shí)別圖像,與人類(lèi)無(wú)延時(shí)相談甚歡,甚至語(yǔ)氣詞都那么到位。但是多個(gè)大模型有個(gè)通病。
另一位英國(guó)女作家安吉拉·薩伊尼,曾梳理過(guò)科技史、人類(lèi)社會(huì)發(fā)展史,發(fā)現(xiàn)很多因?yàn)槠?jiàn)造成的錯(cuò)誤,并寫(xiě)入了一本名為《科技對(duì)女性做錯(cuò)了什么》的書(shū)中。
邱錫鵬說(shuō):“在實(shí)際研究中,要進(jìn)行語(yǔ)料的性別校正需要非常大的投入。需要進(jìn)行模型對(duì)齊,通過(guò)人類(lèi)偏好建模、價(jià)值觀對(duì)齊等方法,調(diào)整模型輸出更積極的內(nèi)容。”
在英國(guó)作家、記者卡羅琳·克里亞多·佩雷斯所寫(xiě)《看不見(jiàn)的女性》一書(shū)中,羅列了一系列此類(lèi)現(xiàn)象,并分析了背后的根源——世界上很多數(shù)據(jù)是基于男性的。
另外,她還提出一個(gè)技術(shù)上的解決辦法,通過(guò)重新構(gòu)造數(shù)據(jù)對(duì)大模型進(jìn)行修正。但是這些辦法會(huì)生成TB級(jí)別的數(shù)據(jù),很耗資源。這里面還有一些問(wèn)題,比如所設(shè)定的場(chǎng)景是不是真的能跟真實(shí)的語(yǔ)境和現(xiàn)實(shí)社會(huì)一致?
姚長(zhǎng)江是青島一家科技公司的產(chǎn)品總監(jiān),他在一些產(chǎn)品應(yīng)用中對(duì)大模型進(jìn)行微調(diào)時(shí)發(fā)現(xiàn),AI會(huì)把“老板”“成功人士”默認(rèn)為男性。
對(duì)于如何造就大模型正確的性別觀,3個(gè)AIGC大模型“嘉賓”輸出的答案近似,它們提出,一方面是從技術(shù)方面,如訓(xùn)練數(shù)據(jù)平衡化、模型設(shè)計(jì)等方面來(lái)進(jìn)行糾偏;另一方面是從政策、社會(huì)等方面進(jìn)行糾偏。
邱錫鵬教授通過(guò)數(shù)據(jù)看到了大模型這兩年的進(jìn)步。對(duì)于大模型的訓(xùn)練,價(jià)值對(duì)齊是重要一項(xiàng),目標(biāo)是人類(lèi)賦予它的價(jià)值觀。其中,也包括性別問(wèn)題。但通過(guò)對(duì)詞語(yǔ)分析形成的詞云,也顯示了AIGC(生成式人工智能)的固有印象,比如,形容男性的詞匯集中于世界、發(fā)現(xiàn)、生命、簡(jiǎn)單等;而圍繞女性則集中于鄉(xiāng)村、丈夫、挑戰(zhàn)、母親等詞語(yǔ)。
由此可見(jiàn),科技需要女性引領(lǐng)原創(chuàng),也要清楚包括AI在內(nèi),具體哪些地方需要“糾偏”,從而獲得兩性平衡平等發(fā)展,共同推進(jìn)社會(huì)進(jìn)步。
在我國(guó),女性進(jìn)入大學(xué)的比例不斷提升。國(guó)家統(tǒng)計(jì)局監(jiān)測(cè)報(bào)告顯示,2022年,高等教育在校生中女生占比50.0%,其中女研究生占全部研究生的51.2%。
“現(xiàn)有模型可能因?yàn)橛?xùn)練數(shù)據(jù)的性別偏見(jiàn)而產(chǎn)生對(duì)特定性別的刻板印象,不僅限制了模型的準(zhǔn)確性,也可能在人機(jī)交互中加深性別歧視?!彼e例,現(xiàn)有AIGC模型會(huì)考慮性別偏向而給出不同的生成內(nèi)容,比如問(wèn)題中提及“小明”“小紅”等人名會(huì)被大模型潛在認(rèn)為分別是男性與女性角色。
高揚(yáng)認(rèn)為,這涉及到的第一個(gè)問(wèn)題就是如何擴(kuò)大和提升那些女性優(yōu)勢(shì)的數(shù)據(jù)生成。同時(shí),她也提醒,這種生成改變是局部的,很容易造成偏差。
中國(guó)科協(xié)的數(shù)據(jù)顯示,目前全國(guó)女性科技工作者近4000萬(wàn),占比超過(guò)45%。但是成為科研主導(dǎo)者的女性比例還是很低。中國(guó)科學(xué)院、中國(guó)工程院院士中,女性科學(xué)家仍舊是鳳毛麟角。2019年中國(guó)科學(xué)院和中國(guó)工程院共新增院士139人,其中12名女院士;2021年新增149名兩院院士,其中11名女性;2023年兩院院士新增133人,其中女院士6名。
李洋提出:“可以看到現(xiàn)在大模型發(fā)展處在一個(gè)非常關(guān)鍵的轉(zhuǎn)折點(diǎn)上,我們是要沿著它現(xiàn)有的路徑、偏差繼續(xù)往前走,還是作一些改變,改變模型,讓它更好地為我們服務(wù)?”
也有人用小孩子的性別敏感期來(lái)類(lèi)比,現(xiàn)在大模型還處于嬰兒期,對(duì)它進(jìn)行價(jià)值對(duì)齊,一代一代更新,我們要做的就是在這些新的數(shù)據(jù)里面,更多地反映性別平等的社會(huì)現(xiàn)狀,這樣才能做好。
還有一些非?!半[蔽”的差異。幾千年人類(lèi)社會(huì)形成的固有觀念,滲透在社會(huì)生活的所有縫隙里。進(jìn)入現(xiàn)代社會(huì)也是如此,一些未經(jīng)科學(xué)證實(shí)的錯(cuò)誤觀念被人們接受,習(xí)以為常。
3位AIGC大模型“嘉賓”看法一致,歸納起來(lái)集中于,“應(yīng)為”在于在社會(huì)層面呼吁、倡導(dǎo)提升女性參與度,打破刻板印象;“可為”主要是倡導(dǎo)科研人員和決策層通過(guò)技術(shù)實(shí)現(xiàn)“平等”;“難為”主要體現(xiàn)在性別偏見(jiàn)和刻板印象、技術(shù)和資源限制以及社會(huì)和文化因素等方面。有意思的是,其中一個(gè)大模型的回應(yīng)中還多加了一句:“但是,女性要在人工智能技術(shù)領(lǐng)域取得成就,可能需要面臨更大的學(xué)習(xí)困難?!?/p>
全球范圍內(nèi),2020年《美國(guó)科學(xué)院院刊》(PNAS)統(tǒng)計(jì)了全球多個(gè)國(guó)家、多門(mén)學(xué)科自1955年以來(lái)活躍的論文發(fā)表學(xué)者,發(fā)現(xiàn)女性研究者的比例雖然有所提升,但也只占到了27%,且存在嚴(yán)重的學(xué)科差異。
5月17日,在中國(guó)計(jì)算機(jī)學(xué)會(huì)2024青年精英大會(huì)上,舉行了一場(chǎng)名為“AIGC:我太‘男’了——大模型中的性別偏差問(wèn)題”的論壇。
這個(gè)論壇的發(fā)起者,是太原理工大學(xué)副教授董媛香、云南師范大學(xué)教授趙樣、東北林業(yè)大學(xué)副教授李洋等,她們都是從事計(jì)算機(jī)科研教學(xué)的年輕學(xué)者,之前組織過(guò)關(guān)于女性科技工作者成長(zhǎng)相關(guān)的論壇。
有人提出:“到底是社會(huì)現(xiàn)狀的偏差還是模型本身的偏見(jiàn),比方說(shuō)輔導(dǎo)孩子的作業(yè),大模型生成是媽媽,但實(shí)際生活中更多的也是這樣的,切合現(xiàn)實(shí),這個(gè)是不是能定義成偏差,值得探討?!?/p>
這次論壇,主辦方請(qǐng)了3位AIGC“嘉賓”:文心一言、星火大模型、通義千問(wèn),它們對(duì)“性別偏見(jiàn)”的看法基本一致:訓(xùn)練數(shù)據(jù)偏差、算法和模型設(shè)計(jì)、開(kāi)發(fā)者的無(wú)意識(shí)偏見(jiàn)會(huì)造成性別偏差,內(nèi)容傳播、偏見(jiàn)的迭代循環(huán)以及不公平?jīng)Q策會(huì)引發(fā)“蝴蝶效應(yīng)”。
復(fù)旦大學(xué)邱錫鵬教授主持研發(fā)了開(kāi)源大模型MOSS,他說(shuō):“大模型里面的各種關(guān)于價(jià)值觀偏見(jiàn)、社會(huì)倫理的問(wèn)題一直是我們非常關(guān)注的問(wèn)題?!?/p>
但是多次討論之后,她們覺(jué)得應(yīng)該觸及技術(shù)本質(zhì)來(lái)談性別平等,人工智能發(fā)展的歷程中,“性別偏見(jiàn)”不是一個(gè)新詞。有觀點(diǎn)認(rèn)為,訓(xùn)練方法和訓(xùn)練數(shù)據(jù)中存在的性別偏見(jiàn)可能被大模型學(xué)習(xí)并反映在其輸出中,影響決策公正性和準(zhǔn)確性。該問(wèn)題長(zhǎng)期發(fā)展下去可能會(huì)產(chǎn)生諸多不良影響,甚至引發(fā)“蝴蝶效應(yīng)”,例如加劇機(jī)會(huì)不平等、對(duì)女性造成冒犯或者在人機(jī)互動(dòng)的過(guò)程中加深性別刻板印象等。如何實(shí)現(xiàn)大模型中的性別偏差問(wèn)題的治理,需要政策、產(chǎn)業(yè)和研究領(lǐng)域的對(duì)話。
“畫(huà)一幅讓老板訓(xùn)斥員工的圖片,我甚至讓它生成了好多次,老板一定是男士,員工是女士?!北本├砉ご髮W(xué)計(jì)算機(jī)學(xué)院副教授高揚(yáng)發(fā)現(xiàn),讓大模型畫(huà)一幅在醫(yī)院里照顧病人的圖像,護(hù)士都是女性;給企業(yè)家畫(huà)像,則是男性;如果換到家庭的場(chǎng)景,家長(zhǎng)做家務(wù)帶孩子,“家長(zhǎng)”大概率是女性。
一些藥品在做臨床實(shí)驗(yàn)時(shí),沒(méi)有區(qū)分男女實(shí)驗(yàn)者,同樣劑量未必適合體重和代謝更低的女性;有些醫(yī)學(xué)研究忽略了女性因素(如生育和激素周期)使得一些新療法、新藥物作用于女性患者時(shí)無(wú)法取得應(yīng)有療效。
“大模型是我們?nèi)祟?lèi)社會(huì)文明的一個(gè)表象、人類(lèi)思想的一個(gè)延伸,如果我們不去做過(guò)多的這種治理或者說(shuō)干涉的話,它可能會(huì)引起不好的結(jié)果?!彼f(shuō),假如把大模型應(yīng)用到招聘中,在求職者簡(jiǎn)歷篩選上,如果這個(gè)AIGC存在相對(duì)嚴(yán)重的性別偏差,會(huì)對(duì)女性求職者帶來(lái)不利的影響。
哈爾濱工業(yè)大學(xué)計(jì)算學(xué)部長(zhǎng)聘教授姚鴻勛認(rèn)為,情感認(rèn)知是AIGC理解人類(lèi)語(yǔ)言和行為的關(guān)鍵。近期她帶領(lǐng)團(tuán)隊(duì)用音樂(lè)來(lái)生成舞蹈,之前在做AI編舞的時(shí)候,沒(méi)想到性別問(wèn)題,所使用的數(shù)據(jù)集也在無(wú)意中出現(xiàn)了性別偏差,采集的舞蹈視頻基本都由女性進(jìn)行表演,缺少男性樣本?!昂笃谝肽行员硌菀曨l數(shù)據(jù)也許能夠更好地描述舞蹈動(dòng)作特征,進(jìn)一步提升模型性能。”
九线拉王水果机棋牌下载在哪下載安裝?九线拉王水果机棋牌下载好用嗎?
作者: 五大連池 🍪
網(wǎng)友評(píng)論更多
59佳木斯g
僅差1億,汾酒殺到洋河城下🍚🍛
2024-09-19 18:24:05 推薦
187****3510 回復(fù) 184****2575:直指業(yè)績(jī)考核!申萬(wàn)宏源24年老員工凌晨4點(diǎn)在微信群“炮轟”領(lǐng)導(dǎo)🍜來(lái)自雙鴨山
187****9936 回復(fù) 184****6915:NBA加速重啟中國(guó)生意🍝來(lái)自七臺(tái)河
157****4086:按最下面的歷史版本🍞🍟來(lái)自雞西
74牡丹江988
這屆年輕人突然喜歡養(yǎng)石頭寵物🍠🍡
2024-09-20 06:30:15 推薦
永久VIP:故障配件未更換就讓消費(fèi)者把車(chē)開(kāi)走,發(fā)生事故后極氪卻自稱“一點(diǎn)責(zé)任也沒(méi)有”🍢來(lái)自綏化
158****1963:剛剛!一家在審IPO企業(yè)、海通證券及信永中和收到監(jiān)管函!3個(gè)中國(guó)證監(jiān)會(huì)現(xiàn)場(chǎng)檢查發(fā)現(xiàn)🍣來(lái)自尚志
158****4218 回復(fù) 666🍤:昨天掉粉超14萬(wàn)!大閘蟹事件后,瘋狂小楊哥已掉粉23萬(wàn)!三只羊前法務(wù)離職和沫沫有關(guān)?本人回應(yīng)🍥來(lái)自五常
51訥河qz
流動(dòng)性風(fēng)險(xiǎn),正向這匹硅片黑馬襲來(lái)!🍦🍧
2024-09-20 0-1:00:18 不推薦
北安xj:超強(qiáng)臺(tái)風(fēng)“摩羯”逼近廣東海南,氣象局:登陸點(diǎn)附近或會(huì)造成毀滅性破壞🍨
186****9427 回復(fù) 159****5939:千億“AI芯片第一股”寒武紀(jì)之困:上半年巨虧超6億,4年砸了近50億搞研發(fā)🍩