Ymestyn Ar Draws yr Ynysoedd: Mae DU-LLM yn Dod 芒 Deallusrwydd Artiffisial i Ieithoedd y DU Gyda NVIDIA Nemotron
Wedi鈥檌 hyfforddi ar yr uwch gyfrifiadur Isambard-AI, mae model newydd a ddatblygwyd gan University College London, NVIDIA a Phrifysgol Bangor yn manteisio ar dechnegau a setiau data ffynhonnell agored NVIDIA Nemotron i alluogi rhesymu Deallusrwydd Artiffisial ar gyfer y Gymraeg ac ieithoedd eraill y DU ar gyfer gwasanaethau cyhoeddus gan gynnwys gofal iechyd, addysg ac adnoddau cyfreithiol.
Ieithoedd Celtaidd 鈥 gan gynnwys Cernyweg, Gwyddeleg, Gaeleg yr Alban a Chymraeg 鈥 yw ieithoedd byw hynaf y DU. Er mwyn grymuso eu siaradwyr, mae menter y DU-LLM yn adeiladu model Deallusrwydd Artiffisial yn seiliedig ar a all resymu yn Saesneg a Chymraeg hefyd, iaith a siaredir gan yng Nghymru heddiw.
Bydd galluogi rhesymu Deallusrwydd Artiffisial o ansawdd uchel yn y Gymraeg yn cefnogi鈥檙 ddarpariaeth o wasanaethau cyhoeddus gan gynnwys gofal iechyd, addysg ac adnoddau cyfreithiol yn yr iaith.
鈥淩wyf am i bob cwr o鈥檙 DU allu harneisio manteision deallusrwydd artiffisial. Drwy alluogi deallusrwydd artiffisial i resymu yn y Gymraeg, rydym yn sicrhau bod gwasanaethau cyhoeddus 鈥 o ofal iechyd i addysg 鈥 yn hygyrch i bawb, yn yr iaith maen nhw鈥檔 byw ynddi,鈥 meddai Prif Weinidog y DU, Keir Starmer. 鈥淢ae hon yn enghraifft bwerus o sut y gall y dechnoleg dddiweddaraf, wedi鈥檌 hyfforddi ar uwch gyfrifiadur deallusrwydd artiffisial mwyaf datblygedig y DU ym Mryste, wasanaethu lles y cyhoedd, amddiffyn treftadaeth ddiwylliannol a datgloi cyfleoedd ledled y wlad.鈥
Mae prosiect DU-LLM, a sefydlwyd yn 2023 fel BritLLM ac a arweinir gan University College London, wedi rhyddhau dau fodel ar gyfer ieithoedd y DU yn flaenorol. Mae ei fodel newydd ar gyfer y Gymraeg, a ddatblygwyd mewn cydweithrediad 芒 Phrifysgol Bangor Cymru ac NVIDIA, yn cyd-fynd ag ymdrechion llywodraeth Cymru i hybu defnydd gweithredol o鈥檙 iaith, gyda鈥檙 nod o gyflawni miliwn o siaradwyr erbyn 2050 鈥 menter o鈥檙 enw .
Bydd darparwr cwmwl Deallusrwydd Artiffisial yn y DU, Nscale, yn sicrhau bod y model newydd ar gael i ddatblygwyr trwy ei ryngwyneb rhaglennu rhaglenni (API).
鈥淵 nod yw sicrhau bod y Gymraeg yn parhau i fod yn iaith fyw, sy鈥檔 anadlu ac sy鈥檔 parhau i ddatblygu gyda鈥檙 oes,鈥 meddai Gruffudd Prys, uwch derminolegydd a phennaeth yr Uned Technolegau Iaith yng Nghanolfan Bedwyr, canolfan y brifysgol ar gyfer gwasanaethau, ymchwil a thechnoleg y Gymraeg. 鈥淢ae deallusrwydd artiffisial yn dangos potensial aruthrol i helpu gyda chaffael y Gymraeg fel ail iaith yn ogystal 芒 galluogi siaradwyr brodorol i wella eu sgiliau iaith.鈥
Gallai鈥檙 model newydd hwn hefyd roi hwb i hygyrchedd adnoddau Cymraeg drwy alluogi sefydliadau cyhoeddus a busnesau sy鈥檔 gweithredu yng Nghymru i gyfieithu cynnwys neu ddarparu gwasanaethau sgwrsfot dwyieithog. Gall hyn helpu grwpiau gan gynnwys darparwyr gofal iechyd, addysgwyr, darlledwyr, manwerthwyr a pherchnogion bwytai i sicrhau bod eu cynnwys ysgrifenedig yr un mor hawdd ar gael yn y Gymraeg ag y mae yn Saesneg.
Y tu hwnt i鈥檙 Gymraeg, mae t卯m y DU-LLM yn anelu at gymhwyso鈥檙 un fethodoleg a ddefnyddiwyd ar gyfer ei fodel newydd i ddatblygu modelau Deallusrwydd Artiffisial ar gyfer ieithoedd eraill a siaredir ledled y DU fel Cernyweg, Gwyddeleg, Sgoteg a Gaeleg yr Alban 鈥 yn ogystal 芒 gweithio gyda chydweithwyr rhyngwladol i adeiladu modelau ar gyfer ieithoedd o Affrica a De-ddwyrain Asia.
鈥淢ae鈥檙 cydweithrediad hwn gydag NVIDIA a Phrifysgol Bangor wedi ein galluogi i greu data hyfforddi newydd a hyfforddi model newydd mewn amser record, gan gyflymu ein nod o adeiladu鈥檙 model iaith gorau erioed ar gyfer y Gymraeg,鈥 meddai Pontus Stenetorp, yr athro prosesu iaith naturiol a dirprwy gyfarwyddwr y Ganolfan Deallusrwydd Artiffisial yn University College London. 鈥淓in nod yw cymryd y mewnwelediadau a gafwyd o鈥檙 model Cymraeg a鈥檜 cymhwyso i ieithoedd lleiafrifol eraill, yn y DU ac ar draws y byd.
Manteisio ar Seilwaith Deallusrwydd Artiffisial Sofran ar gyfer Datblygu Model
Mae鈥檙 model newydd ar gyfer y Gymraeg yn seiliedig ar , teulu o fodelau ffynhonnell agored sy鈥檔 cynnwys pwysau, setiau data a ryseitiau agored.Mae鈥檙 t卯m datblygu DU-LLM wedi manteisio ar fodel 49-biliwn-paramedr Llama Nemotron Super a model 9-biliwn-paramedr Nemotron Nano, gan eu ar ddata iaith Gymraeg.
O鈥檌 gymharu ag ieithoedd fel Saesneg neu Sbaeneg, mae llai o ddata ffynhonnell ar gael yn y Gymraeg ar gyfer hyfforddiant Deallusrwydd Artiffisial. Felly, er mwyn creu set ddata hyfforddi Cymraeg ddigon mawr, defnyddiodd y t卯m ficrowasanaethau ar gyfer a i gyfieithu gyda dros 30 miliwn o gofnodion o鈥檙 Saesneg i鈥檙 Gymraeg.
Defnyddion nhw glwstwr GPU drwy blatfform ac yn harneisio cannoedd o ar 鈥 uwchgyfrifiadur mwyaf pwerus y DU, gyda chefnogaeth ac wedi鈥檌 leoli ym Mhrifysgol Bryste 鈥 i gyflymu eu llwythi gwaith cyfieithu a hyfforddi.
Mae鈥檙 set ddata newydd hon yn ategu data presennol yr iaith Gymraeg o ymdrechion blaenorol y t卯m.
Cipio Naws Ieithyddol Gyda Gwerthusiad Gofalus
Mae Prifysgol Bangor, sydd wedi鈥檌 lleoli yng Ngwynedd 鈥 y sir gyda鈥檙 鈥 yn cefnogi datblygiad y model newydd gydag arbenigedd ieithyddol a diwylliannol.
Mae Prys, o ganolfan Gymraeg y brifysgol, yn dod 芒 thua dau ddegawd o brofiad gyda thechnoleg iaith ar gyfer y Gymraeg i鈥檙 cydweithrediad. Mae ef a鈥檌 d卯m yn helpu i wirio cywirdeb data hyfforddi a gyfieithir gan beiriannau a data gwerthuso a gyfieithir 芒 llaw, yn ogystal ag asesu sut mae鈥檙 model yn ymdrin 芒 naws Gymraeg y mae Deallusrwydd Artiffisial fel arfer yn cael trafferth 芒 nhw 鈥 megis y ffordd y mae cytseiniaid ar ddechrau geiriau Cymraeg yn newid yn seiliedig ar eiriau cyfagos.
Disgwylir i鈥檙 model, yn ogystal 芒鈥檙 setiau data hyfforddiant a gwerthuso鈥檙 Gymraeg, fod ar gael i fentrau a鈥檙 sector cyhoeddus eu defnyddio, gan gefnogi ymchwil ychwanegol, hyfforddiant modelu a datblygu rhaglenni.
鈥淢ae鈥檔 un peth cael y gallu Deallusrwydd Artiffisial hwn yn bodoli yn y Gymraeg, ond mae鈥檔 beth arall ei wneud yn agored ac yn hygyrch i bawb,鈥 meddai Prys. 鈥淕all y gwahaniaeth cynnil hwnnw fod y gwahaniaeth rhwng y dechnoleg hon yn cael ei defnyddio ai peidio.鈥
Defnyddio Modelau Deallusrwydd Artiffisial Sofran Gyda NVIDIA Nemotron, Microwasanaethau NIM
Gall y fframwaith a ddefnyddiwyd i ddatblygu model DU-LLM ar gyfer y Gymraeg fod yn sylfaen ar gyfer datblygu Deallusrwydd Artiffisial amlieithog ledled y byd.
Mae modelau, data a ryseitiau Nemotron, sy鈥檔 cyrraedd y brig, ar gael yn gyhoeddus i ddatblygwyr er mwyn iddynt adeiladu modelau rhesymu sydd wedi鈥檜 teilwra i bron unrhyw iaith, parth a llif gwaith. Wedi鈥檜 pecynnu fel microgwasanaethau NVIDIA NIM, mae modelau Nemotron wedi鈥檜 hoptimeiddio ar gyfer cyfrifiadura cost-effeithiol a rhedeg yn unrhyw le, o liniadur i鈥檙 cwmwl.
Bydd mentrau Ewrop yn gallu rhedeg wedi鈥檌 bweru gan Ddeallusrwydd Artiffisial.
Dewch i ddechrau arni gyda .