Home FeaturesTechnology ග්‍රැෆික් නිර්මාණකරුවන්ට රැකියා අහිමි කරවන කෘත්‍රිම බුද්ධි කලාකරුවා

ග්‍රැෆික් නිර්මාණකරුවන්ට රැකියා අහිමි කරවන කෘත්‍රිම බුද්ධි කලාකරුවා

by cmadurawala

කෘත්‍රිම බුද්ධිය සහ පරිගණක තාක්ෂණය දශක ගණනාවක් තිස්සේ දියුණු වෙමින් පැවත එන්නකි. අද වන විට රටා හඳුනාගැනීම, ඒ රටා ඇසුරින් ඉදිරිය පුරෝකථනය කිරීම සහ බොහෝ තාක්ෂණික කාරණාවල දී මිනිස් මැදිහත් වීමකින් තොර ව තීරණ ගැනීමේ සහ ක්‍රියා කිරීමේ ඉතා හොඳ ශක්‍යතාවක් කෘත්‍රිම බුද්ධිය අත් කරගෙන ඇත. එහෙත් අතීතයේ සිට ම බොහෝ දෙනා විශ්වාස කළේ කෘත්‍රිම බුද්ධිය කිසි ම දිනක මානවයා හා සම කිරීමට නො හැකි වනු ඇති බවයි. මෙම විශ්වාසයට මූලික ව හේතු වූයේ විශේෂයෙන් කලාව, නිර්මාණශීලීත්වය වැනි සියුම් මානව සිතැඟිවල පහස අවශ්‍ය වන ක්ෂේත්‍රයි. එක් එක් පුද්ගලයා සතු ව සහජයෙන් පවතින නිර්මාණශීලීත්වය, නිර්මාණ පිළිබඳ ප්‍රඥාව, කලා රසය කෘත්‍රිම ව නිෂ්පාදනය කරනු ලබන යන්ත්‍රයකට හෝ ක්‍රමයකට ස්වයං ව ජනනය කිරීමට හැකියාවක් ඇති නො වනු බැව් ඔවුන්ගේ විශ්වාසය විය.


එහෙත් කෘත්‍රිම බුද්ධියේ ඝාතීය පරිණාමය මේ වන විට මේ සියලු විශ්වාසයන් හුදු හිතලු බවට පත් කරමින් සිටියි. සුවිශේෂී යැයි කියාගත් මානව හැකියාවන් එය ඉතා පහසුවෙන් අතික්‍රමණය කරමින් සිටියි. මේ පිළිබඳ ඉතා ම මෑතකාලීන උදාහරණය DALL-E 2ය. එමඟින් අභියෝගයට ලක් වන මානව හැකියාව අන් කවරක් වත් නො ව නිර්මාණශීලීත්වයයි.


2022 අප්‍රේල් මස කෘත්‍රිම බුද්ධිය පිළිබඳ පර්යේෂණ හා සංවර්ධන කටයුතු කරන සුපතළ OpenAI සමාගම විසින් DALL-E 2 නම් සිය නවතම නිෂ්පාදනය පිළිබඳ පර්යේෂණ පත්‍රිකාව එළි දක්වනු ලැබී ය. මෙය මූලික ව ග්‍රැෆික් නිර්මාණ කිරීමේ හැකියාව ඇති කෘත්‍රිම බුද්ධි වැඩසටහනකි. එහි ඇති විශේෂත්වය නම් එයට ලබා දෙන ඕනෑ ම පාඨයක් ඇසුරින්, එමඟින් විස්තර වන අන්දමේ රූපයක් (Text to art) නිර්මාණය කිරීමට එයට හැකි වීමයි.


මෙය මූලික වශයෙන් GPT3 නම් Text Generation පද්ධතිය ඇසුරු කරගෙන ක්‍රියා කරයි. DALL-E 2, 2021 වර්ෂයේ දී එළි දැක්වුණු DALL-Eහි නව යාවත්කාලීන කරන ලද අනුවාදයයි (Updated Version). DALL-E 2හි 2021 එළිදැක්වුණු මුල් අනුවාදයට ද මේ හැකියාව තිබුණත් ඊට නිපදවිය හැකි වුණේ කාටූන් ස්වභාවයේ රූප පමණකි. එහෙත් DALL-E 2 ඊට වඩා පියවර ගණනාවක් ඉදිරියට තබා ඉහළ ගුණාත්මක භාවයක් සහිත ව කලාත්මක ගතිගුණ, සංකීර්ණ පසුතල, වර්ණ සංයෝජන සහ රූපමය ප්‍රයෝග සහිත අධි විභේදන (High resolution) රූප තත්පර දහයක් වැනි කාලයක් තුළ ජනනය කිරීමේ හැකියාව ලබාගෙන ඇත. එමෙන් ම පවතින රූපයක් අවශ්‍යතාවය අනුව සංස්කරණය (edit) කිරීමේ හැකියාව ද මෙය සතු ය.


බැලූ බැල්මට මේ තාක්ෂණය ඉතා සරල දෙයක් බව ඔබට සිතෙනු ඇත. කලින් ලබාගත් පින්තූර රාශියක ගොනුවක් ඇසුරින් අලුත් රූපයක් නිර්මාණය කිරීම එතරම් අපහසු දෙයක් නො වේ යැ යි ඔබට සිතෙනු ඇත. එහෙත් හොඳින් මේ රූපය දෙස බලන්න.

ප්‍රදානය කළ විස්තරය – “A dolphine in an Astronaut suit on saturn “
(සෙනසුරු මත ගගනගාමී ඇඳුමකින් සැරසී සිටින ඩොල්ෆින්)
පරිගණකයකට මෙතරම් දෙයක් තනි ව ම සිදු කළ හැකි දැ යි ඔබ කිසි දිනෙක සිතුවේ ද? බලන්න, මෙහි වර්ණ යොදාගෙන ඇති අන්දම. අභ්‍යවකාශයේ සිටිනා ජීවියෙකුගේ ඉරියව්, ආලෝකකරණය. මෙතෙක් කල් මිනිස් බුද්ධියකින් පමණක් තීරණය කළ හැකි යැ යි සිතා සිටි කලාත්මක තීරණ ගැනීමට තරම් DALL-E 2 දියුණු වී හමාර ය. පහත පින්තූරය එය තවදුරටත් පැහැදිලි කරනු ඇත.

ප්‍රදානය කළ විස්තරය – – ” a propaganda poster depicting a cat dressed as french emperor napoleon holding a piece of cheese.”
(ප්‍රංශ අධිරාජයා වූ නැපෝලියන් ලෙස සැරසුණු බළලෙකු චීස් කැබැල්ලක් අතැති ව සිටින අයුරු දැක්වෙන ප්‍රචාරක පෝස්ටරයක්)

ඔබ අලෙවිකරුවෙකු නම් ඔබට අවශ්‍ය පරිදි පෝස්ටරයක් සකසාගැනීමට අනාගතයේ දී ග්‍රැෆික් නිර්මාණකරුවෙකුගේ හෝ චිත්‍ර ශිල්පියෙකුගේ හෝ පිහිට පැතීමට ඔබට සිදු නො වනු ඇති බව මේ අනුව පෙනී යයි. ඔබට කැමැති පරිදි සංකල්පය DALL-E 2 වෙත ලබා දීමෙන් ඔබට අවශ්‍ය කරන පෝස්ටරය ඉතා ම කලාත්මක ආකාරයෙන් නිර්මාණය කරගත හැකියි. කිසිසේත් ම පරිගණකයක් මඟින් නිර්මාණය කළ රූපයක් ලෙස හැඳින්විය නො හැකි තරමට ම, සැබෑ ලෝකයේ පවතින ආකාරයෙන් අවශ්‍ය රූපය නිර්මාණය DALL-E 2 සමත් වී හමාර ය.

ප්‍රදානය කළ විස්තරය “a teddy bear on a skateboard in times square.”
(ටයිම්ස් චතුරස්‍රයේ ස්කේට්බෝඩ් එකක ටෙඩි බෙයාර් කෙනෙක්)

කෘත්‍රිම කලාකරුගේ ක්‍රියාකාරිත්වය


DALL-E 2හි ක්‍රියාකාරිත්වය සැලකූ විට කිසිසේත් ම එය පෙර සකසන ලද රූප ගබඩාවකින් රූප උකහාගන්නා ආකාරයේ තාක්ෂණයක් නො වන බව පැහැදිලිව පෙනී යයි. මක් නිසා ද යත් DALL-E 2හි නිර්මාණශීලීත්වය එවැනි තාක්ෂණයකින් ලබාගත නො හැකි බැවිනි. OpenAI මඟින් නිෂ්පාදනය කළ, මෙහි භාවිත වන ප්‍රධාන තාක්ෂණික අංග දෙකකි. එනම් CLIP (Contrastive Language-Image Pre-Training) සහ පරිගණක භාෂාව සහ මිනිස් භාෂාවන් සමග හොඳින් සන්නිවේදනය (තේරුම්ගැනීම, ප්‍රතිචාර දැක්වීම) කළ හැකි GPT-3 පරිගණක ආකෘතියයි.


CLIP මූලික වශයෙන් භාෂා ආකෘතියක් සහ රූප වර්ගීකරණය කිරීමේ ආකෘතියකින් සමන්විතයි. මෙමඟින් අන්තර්ජාලයෙන් එක්රැස් කරගත් ඡායාරූප ඔස්සේ එම ඡායාරූප මිනිසාට තේරුම්ගත ගත හැකි ආකාරයෙන් වර්ගීකරණය කිරීම සහ විස්තර කිරීම සිදු කළ හැකියි. එහෙත් DALL-E 2හි දී මෙහි ප්‍රතිවිරුද්ධ ක්‍රියාවලිය, එනම් විස්තරයක් ඇතුළත් කළ විට ඊට ගැළපෙන රූපයක් නිර්මාණය කිරීම සිදු කිරීමට OpenAI සමාගම මෙහි දී කටයුතු කර ඇත. එමෙන් ම කෘත්‍රිම රූපයක් නිර්මාණය කිරීමට එහා ගිය, නරඹන්නන්ගේ සිත් ගන්නා කලාත්මක රූපයක් නිර්මාණය කිරීමට OpenAI විසින් මේ කෘත්‍රිම බුද්ධි වැඩසටහන පුහුණු කරවනු ලබයි. මේ ක්‍රියාවලිය Aesthetic Quality evaluation ලෙස හැඳින්වේ. සාමාන්‍ය රූප ජනනය කරන කෘත්‍රිම බුද්ධි ආකෘතියකට එහා ගිය, මානව සිත් ඇද බැඳගත හැකි රූප නිර්මාණය කිරීමට DALL-E 2 හට හැකි වන්නේ මේ නිසාවෙනි.


DALL-E 2හි ඇති සුවිශේෂී හැකියා යහපත් ආකාරයෙන් යොදාගැනීමට ඉතා විශාල අවකාශයක් ඇතත් කෙනෙකු හට මෙය අයහපත් ආකාරයෙන් යොදාගැනීමට ද යම් හැකියාවක් පවතී. මෙය වැළැක්වීම සඳහා in-built ආරක්ෂක උපක්‍රම කිහිපයක් OpenAi සමාගම යොදා ඇත. මෙමඟින් යම් නිශ්චිත පුද්ගලයෙකු, ලෝක දේශපාලනය යම් විශේෂ සිදුවීමක් ඉලක්ක කොට නිර්මාණ වැළැක්වීම සිදු කෙරේ. එමෙන් ම g – rated ගණයට නො වැටෙන කිසිදු අයිතමයක් upload හෝ නිර්මාණය කිරීම DALL-E 2 මඟින් සිදු නො කෙරේ. මීට අමතර ව හානිදායක, සමාජ විරෝධී සහ නීති විරෝධී මාතෘකා DALL-E 2 හි අවහිර කිරීමට ද OpenAI සිය ආකෘතිය පුහුණු කරමින් සිටියි.


අතිසාර්ථක කෘත්‍රිම බුද්ධි සංකල්පයක් වුවත් තවමත් DALL-E 2හි තට්ටු වශයෙන් ඇති වර්ණ නම් කිරීමේ ඇති අපහසුතා වැනි මෙහෙයුම් දුර්වලතා කිහිපයක් දක්නට ලැබේ. තවමත් ඕනෑ ම කෙනෙකුට භාවිත කළ හැකි පරිදි පොදු අවකාශයට නිකුත් කර නැතත් පරිගණක විද්‍යාඥයන්ට, පර්යේෂකයන්ට තාක්ෂණික පැතිකඩ අධ්‍යයනය කිරීමට හා තවදුරටත් එය දියුණු කිරීමට සමාගම ඉඩ සලසා ඇත. එමෙන් ම හානිදායක නො වන ආකාරයෙන් සමාජයට සහ තුන්වැනි පාර්ශව මෘදුකාංගවලට මුදාහැරීමට අදහස් ලබා දීමටත් අවකාශය ඇත.

ප්‍රදානය කළ විස්තරය – “A close up of a handpalm with leaves growing from it”
(කොළ වැඩෙන අත්ලක සමීප රූපයක්)


DALL-E 2 පළමුවරට නිකුත් වීම සමග නිර්මාණකරුවන්ගේ ලෝකය සසල විය. බොහෝ ග්‍රැෆික් නිර්මාණකරුවෝ, ශිල්පීහු “අපගේ වෘත්තීය අවසානයයි” ආදි ලෙස නොයෙක් සටහන් තබන්නට වූ හ. එහෙත් OpenAI සමාගම පවසන පරිදි ඔවුන්ගේ ඉලක්කය නිර්මාණකරණය ජනසතු දෙයක් බවට පත් කිරීමයි. එමෙන් ම DALL-E 2 යනු කෘත්‍රිම බුද්ධියේ අනාගතය වන මිනිසා සම වන හෝ අභිබවා යන මට්ටමේ කෘත්‍රිම බුද්ධියක් වන General Artificial Intelligence(GAI) එකක් නිෂ්පාදනය දක්වා OpenAI ගමන් කරන මාර්ගයේ එක් පියවරක් බව ඔවුන්ගේ දැක්මයි.


අනාගතයේ DALL-E 2, නිර්මාණකරණ කාර්යය කවර ආකරයකින්, කවර දිශානතියට හරවා වි ද යන්න අනාගතය විසින් තීරණය කෙරෙනු ඇත. මෙතක් කල් කලාව යන වපසරියක තුළ මානව අනන්‍යතාවය පවත්වාගෙන යනු ලැබූවේ නිර්මාණශීලීත්වය විසිනි. ඒත් හෙට ඒ සියලු නිර්වචන අලුතෙන් ලිවීමට සිදු වනු ඇත. DALL-E 2 මෑත අනාගතයේ දී ම මින් ඔබ්බට ගොස් ඕනෑ ම කෙනෙකුට තම සිතැඟි වචනවලට පෙරළා පරිගණකය මත සටහන් කිරීමෙන් එය ක්ෂණයෙන් කෘත්‍රිම බුද්ධිය දකින ආකාරයට තිරය මත වීඩියෝවක් ලෙස ප්‍රතිනිර්මාණය කරනු ඇත. නිර්මාණශීලීත්වය උදෙසා මානව සාධකය අත්‍යවශ්‍ය ම ද? අනාගතය විසින් එය නිශ්චිත ව තීරණය කෙරෙනු ඇත.

තුෂාන් රණතුංග
කැලණිය විශ්වවිද්‍යාලය

Leave a Comment

You may also like

logo2

1987 සිට මේ දක්වා ශ්‍රී ලංකාවේ අඛණ්ඩව සතිපතා පළවන එක ම විද්‍යා ප්‍රකාශනය වන විදුසර විද්‍යා සඟරාව, නිවැරදි විද්‍යා දැනුම සරලව හා ආකර්ශනීයව ඉදිරිපත් කරමින් ලංකාවේ සිසු දරු දැරියන් හා සාමාන්‍ය ජනතාව අතර විද්‍යාව ප්‍රචලිත කිරීම උදෙසා කැප වී සිටියි.

Contact Us

via Email

via Phone

For Advertising

Our Publications