2024 年 11 月 14 日,“大模型與語言資源學術(shù)研討會暨粵語語料庫建設(shè)與大模型評測重點實驗室啟動會” 在廣州大學(黃埔校區(qū))舉行。該重點實驗室由廣州大學和廣州市社會科學界聯(lián)合會聯(lián)合共建。其相關(guān)情況如下:
- 研究方向:
- 粵語文化精神標識體系研究:深入探究粵語文化的核心精神、獨特標識,為粵語文化的精準定位和深度理解提供理論支持,以便更好地在大模型應(yīng)用中體現(xiàn)粵語文化的特色。
- 通用粵語語料庫建設(shè):收集、整理、標注大量的粵語語料,建立起全面、準確、通用的粵語語料庫,為大模型的訓練和優(yōu)化提供基礎(chǔ)數(shù)據(jù)支持。
- 大模型粵語言語交互質(zhì)量評測:制定科學的評測標準和方法,對大模型在粵語語言交互方面的質(zhì)量進行評估,包括語言理解的準確性、語言生成的自然度、語義表達的完整性等方面。
- 大模型粵語言語交互質(zhì)量提升研究:基于評測結(jié)果,研究如何改進大模型的算法和技術(shù),提高其在粵語語言交互方面的質(zhì)量和效果,以滿足用戶的需求。
- 運行機制與合作模式:
- 運行機制:采取 “1+1+n” 的運行機制,即由廣州大學和廣州市社會科學界聯(lián)合會聯(lián)合共建,同時聯(lián)合廣東、香港、澳門的學術(shù)團體以及互聯(lián)網(wǎng)企業(yè)等多方面力量共同參與。
- 合作模式:采取政產(chǎn)學研用一體化的模式,形成圍繞粵語語料庫建設(shè)與智能化服務(wù)的合作生態(tài)。以廣州大學為主體,依托學校的網(wǎng)絡(luò)空間安全學院、人文學院、新聞與傳播學院等多個學院的學科優(yōu)勢和專業(yè)資源,打造跨學科協(xié)同創(chuàng)新科研平臺。
- 重要意義:
- 文化傳承方面:粵語作為中華文化的瑰寶,承載著粵港澳大灣區(qū)深厚的歷史文化底蘊。該實驗室的成立有助于推動粵語文化的數(shù)字化傳承,保護和傳承這一寶貴的文化遺產(chǎn)。
- 學術(shù)研究方面:為多學科交叉融合創(chuàng)新研究提供了平臺,探索具有中國特色、嶺南風格的城市文化傳承、保護與發(fā)展之路,將成為廣州大學跨學科發(fā)展中的重要學術(shù)平臺。
- 區(qū)域發(fā)展方面:能在粵港澳大灣區(qū)乃至全球的文化交流與合作中發(fā)揮積極作用,對于推動大灣區(qū)的文化融合和發(fā)展具有重要意義。
- 專家團隊:設(shè)立 “雙首席科學家”。由中國工程院院士、廣州大學網(wǎng)絡(luò)空間安全學院名譽院長方濱興,香港科技大學(廣州)黨委書記、國家語委科研機構(gòu)國家語言服務(wù)與粵港澳大灣區(qū)語言研究中心主任屈哨兵教授分別擔任重點實驗室技術(shù)首席專家與語言首席專家,承擔學術(shù)指導和咨詢工作,保障重點實驗室學術(shù)發(fā)展方向。
該實驗室第一期建設(shè)周期為五年,長遠目標是成為立足粵港澳大灣區(qū)、面向國家語言服務(wù)戰(zhàn)略、通用粵語語料庫及大模型粵語服務(wù)評測的國內(nèi)乃至全球首屈一指的科研與對外服務(wù)專業(yè)學術(shù)性機構(gòu)。 |