Про деякі перспективи застосування штучного інтелекту в енциклопедистиці


РЕЗЮМЕ

У дослідженні показано один із шляхів використання генеративного штучного інтелекту для роботи з енциклопедичними статтями, зокрема висловлено ідею про можливість створення на ресурсах знань додаткового контенту, призначеного для узагальнення інформації, що міститься у цих статтях (генерація ключових тез, анотацій, конспекту тощо засобами штучного інтелекту). Додаткові текстові блоки, створені генеративним штучним інтелектом, на думку авторів, були б цікавими і корисними для читачів – покращували б у них сприйняття і засвоєння інформації, давали б можливість швидко знайомитися зі змістом розлогих статей. Дослідження на прикладі окремих статей “Енциклопедії Сучасної України” засвідчує, що такі віртуальні асистенти, як ChatGPT та Gemini демонструють належний рівень у створенні відповідного додаткового контенту. Водночас автори наголошують на ризиках зловживання редакціями штучним інтелектом, оскільки завдяки ньому з’являється можливість генерувати й основний контент – статті – замість авторів, а це викликатиме питання щодо їх точності, надійності й цінності загалом. Насамкінець, у статті акцентовано на необхідності наукового обговорення питань щодо стандартів етичного використання штучного інтелекту в енциклопедичній справі.


ВСТУП

Вплив новітніх технологій на всі сфери людського життя поступово трансформує суспільство, підносячи здобутий освітній рівень і наявні знання у головні чинники соціальної диференціації та добробуту особистості (Андрієвська 2018, 3). Серед таких технологій сьогодення — генеративний штучний інтелект (ГШІ), створений на базі великих мовних моделей та глибокого машинного навчання штучних нейронних мереж, що відкриває нові перспективи в науці, бізнесі, культурі, суспільному житті.

До важливих можливостей ГШІ нині уналежнюють синтезування (генерування) письмового й усного мовлення, форма і зміст якого демонструють розумову здатність (когнітивні здібності), а також графічних, фото- та відеооб’єктів (Jovanović, Campbell, 2022). У цій статті зосередимося на питаннях, пов’язаних лише з можливістю ГШІ продукувати тексти.

Одразу зауважимо, що використання відповідного інструментарію для написання енциклопедичних статей замість авторських ми не розглядаємо як перспективні рішення у галузі енциклопедистики (докладніше про це автори порушують у статті “Online encyclopedias and generative artificial intelligence: challenges and opportunities (case of the Encyclopedia of Modern Ukraine)”, що нині готується до друку в журналі “Science and Innovation”). Щоправда, у багатьох інших сферах діяльності саме ця функція штучного інтелекту після появи таких віртуальних помічників, як ChatGPT (Open AI), Gemini (Google LLC), Copilot (Microsoft Corporation) тощо, стала нормою. Приміром, в електронній комерції багато компаній істотно зменшили чи навіть відмовилися від копірайтерів, які займалися створенням контенту для інтернет-магазинів, — тепер опис товарів у них покладено на технології ГШІ, який робить це в автоматичному режимі. За окремими дослідженнями, віртуальні асистенти попри те, що мають свої недоліки, для багатьох інтернет-магазинів здатні не лише замінити копірайтерів, а й навіть покращити якість опису товарів, що збільшує продажі (Сербін, 2023).

Уважаємо, що у разі, якщо тексти енциклопедичних статей почнуть генерувати засобами штучного інтелекту, то це не лише примітивізує відповідні видання чи онлайн-ресурси, а й знецінить галузь загалом, згубно вплине на розвиток енциклопедизму (збереження, примноження й поширення достовірних знань у довідковому форматі), адже в сучасних умовах величезної кількості інформаційних джерел цінність енциклопедій — передусім в їхніх авторах, які мають високий професійний авторитет, володіють не лише відповідними знаннями, а й досвідом, а багато хто і мудрістю. Водночас потенціал штучної генерації текстів розглядаємо на рівні інших можливих напрямів їх застосування, покращуючи процеси підготовки енциклопедичної продукції та поширення енциклопедичних знань у суспільстві. Відтак мета нашої статті — продемонструвати якість текстів, синтезованих штучним інтелектом, які можна використовувати як додатковий матеріал поруч з основним — авторським контентом енциклопедичної статті.

Останнім часом чимало у світі онлайн-енциклопедій створено як багатофункціональні (інтерактивні) інформаційні бази. Це передбачає те, що вони — не лише джерело довідкової інформації, а й, наприклад, дидактичний ресурс, що здатний бути корисним у навчальному процесі (Железняк & Іщенко 2021). Цю енциклопедичну практику важливо переймати й українським фахівцям, адже “побудова ефективних систем інформатизації освіти з урахуванням світового досвіду, особливостей і реалій стану вітчизняної освіти — питання, яке заслуговує особливої уваги сучасної наукової теорії і практики” (Близнюк 2017, 69). Для дидактичної літератури (підручники, посібники тощо) зазвичай характерне поєднання теоретичної складової з практичною, спрямованою на засвоєння навчального матеріалу. Практичний блок інформації, що супроводжує статті, був би доречний у будь-якій електронній енциклопедії, адже очевидно підвищував би її евристичний потенціал.

Наша ідея полягає в тому, що ця (створена ГШІ) інформаційна панель може подавати ключові тези енциклопедичної статті, які сприятимуть глибшому розумінню змісту прочитаного, кращому засвоєнню знань. Надто важливим такий блок анотованої інформації у розлогих статтях — не кожен пересічний користувач енциклопедій має бажання читати довгі тексти, а от скорочені версії великих статей у вигляді найважливіших фрагментів стали б у пригоді. Отже, ключові тези в енциклопедичних статтях були б корисними як з точки зору засвоєння матеріалу (наприклад, в освітньому процесі), так і для швидкого ознайомлення з довідковою інформацією (на кшталт резюме чи конспекту статті).

МАТЕРІАЛ І МЕТОДИ

У технічному плані створення штучним інтелектом додаткового блоку інформації на основі енциклопедичної статті передбачає опрацювання тим чи іншим віртуальним асистентом її тексту (через API-доступ до сайту чи бази даних енциклопедії) і на основі його змісту — формулювання результату. З метою перевірки потенціалу генеративного штучного інтелекту для виконання такої роботи ми провели невеликий експеримент. Для цього звернулися до двох асистентів — ChatGPT і Gemini (вибір кількох викликаний бажанням з’ясувати відмінності між ними при виконанні відповідних завдань). На їхніх сайтах у комунікативній панелі чат-боту поставили завдання: “Напиши ключові тези цієї статті (не більше 5 тез):” та подали скопійований текст статті. Матеріалом для експерименту обрано “Енциклопедію Сучасної України”, зокрема дві статті “Буржуазний націоналізм1 та “Націоналізм2 (вибір цих статей зумовлений тим, що їх часто переглядають користувачі інтернету, а тому автоматично згенеровані ключові тези були б у фокусі уваги широкої аудиторії). Штучному інтелекту пропоновано лише тексти статей (список рекомендованої літератури, прізвище й ініціали авторів не зазначали). Також варто уточнити, що стаття “Націоналізм” складається з двох частин — у першій поняття націоналізму висвітлює Володимир Кулик, у другій — Василь Лісовий. До експерименту залучили лише версію, підготовлену В. Куликом.

Експеримент 1

БУРЖУА́ЗНИЙ НАЦІОНАЛІ́ЗМ — термін, розроблений марксистсько-ленінськими ідеологами, який мав означати націоналізм як учення у викладі небільшовицьких ідеологів. Історично цей термін прийшов на зміну термінові «буржуа-націоналіст», поширеному в Німеччині та Італії 2-ї чв. 19 ст. Перший складник терміна («буржуазний») був пов’язаний із характеристикою прошаркових інтересів мешканців середньовічних містечок або великих замків чи містечок із замками. Другий складник («націоналізм») — з ученнями про месіанізм моноетнічної держави (витоки простежують від давнього юдаїзму й тези про богообраний народ). У Радянській Україні найчастіше використовували термін «український буржуазний націоналізм», засновником якого оголосили М. Грушевського. Оскільки, на думку більшовиків-ленінців, класові передумови для поширення українського Б. н. із розгромом національно-визвольного руху і національної церкви знищено, то він виявлявся переважно в антикомуністичній діяльності діаспори та її агентури.

Український Б. н. (іноді в поєднанні з сіонізмом чи з неофашизмом) фігурував як ідеол. виправдання репресій 60–70-х рр. в Україні, а також як обґрунтування боротьби з діаспорою. Теоретичні рекомендації щодо характеристики українського Б. н. та методів боротьби з ним розробляли під проводом КПУ, спецслужб та різних наукових інститутів. Праці цих «бійців ідеологічного фронту» містили як правдиві матеріали з української історії, так і фальсифікати. За радянського режиму як джерела, так і більшість праць у цій галузі мали секретний або напівсекретний характер, особливо якщо йшлося про боротьбу з національною церквою, зарубіжними організаціями тощо. Боротьба з українським Б. н. була одним з основних напрямів ідеологічної роботи КПУ. В Україні історія більшовицької боротьби з українським Б. н. досі не вивчена.

Результати експерименту

Ключові тези статті Буржуазний націоналізм (відповідь Gemini):

  1. Визначення та походження терміну: “Буржуазний націоналізм” був ідеологічним штампом, розробленим марксистами-леніністами для дискредитації будь-якого національного руху, який не підтримував їхню ідеологію.
  2. Застосування в Україні: В Україні цей термін найчастіше використовувався для дискредитації українського національного руху, зокрема, його лідера Михайла Грушевського.
  3. Мета використання: Метою використання цього терміна було виправдання репресій проти українських націоналістів, а також обґрунтування боротьби з українською діаспорою.
  4. Характеристика досліджень: Дослідження на тему “буржуазного націоналізму” в радянський період часто були фальсифікованими і використовувалися для ідеологічної боротьби.
  5. Невивченість теми: Історія боротьби з українським “буржуазним націоналізмом” в Україні досі залишається недостатньо дослідженою.

Ключові тези статті Буржуазний націоналізм (відповідь ChatGPT):

  1. Походження терміну: “Буржуазний націоналізм” був створений марксистсько-ленінськими ідеологами для позначення небільшовицьких націоналістичних ідей, пов’язаних із прошарковими інтересами міського населення та ідеями моноетнічної держави.
  2. Український буржуазний націоналізм: Радянська пропаганда вважала Михайла Грушевського засновником українського буржуазного націоналізму і використовувала цей термін для дискредитації національно-визвольного руху та діяльності української діаспори.
  3. Ідеологічні репресії: Термін активно застосовувався радянською владою для виправдання репресій у 1960-70-х роках проти інтелігенції, національних діячів та церкви в Україні.
  4. Секретність досліджень: Більшість праць, що досліджували український буржуазний націоналізм, залишались секретними або напівсекретними за радянських часів, особливо ті, що стосувалися боротьби з національною церквою і діаспорою.
  5. Невивченість теми: Історія радянської боротьби з українським буржуазним націоналізмом досі не отримала належної уваги у сучасних дослідженнях.

Експеримент 2

НАЦІОНАЛІ́ЗМ — почуття, ідеологія та політична дія, що серед усіх ідентифікацій людини найбільшого значення надає її належності до спільноти, названої нацією, та, відповідно, вважає цю спільноту важливою вартістю, а турботу про інтереси нації — непорушним обов’язком її членів. Згідно з націоналістичним уявленнями, чільне місце серед цих інтересів посідає збереження самої нації, її мови, культури й традиційної території, утвердження належного місця у світі, а також творення й подальше підтримання власної держави, яка своїм головним обов’язком повинна вважати забезпечення добробуту нації. Прагнення утвердити інтереси своєї нації веде націоналістів до більш чи менш активної боротьби проти інших, насамперед сусідніх націй (та їхніх націоналістів), які сприймаються як загроза цим інтересам. Тому згідно з поширеним серед загалу й частини науковців тлумаченням, питомою рисою Н. вважають агресивність і зверхність щодо інших націй і вважають його тотожним шовінізмові. У науковій літературі переважає тлумачення, відповідно до якого агресивною є лише крайня форма Н., а поміркованіші обстоюють місце своєї нації як рівної серед інших та захищають її від зазіхань на існування й добробут. Таким чином, широко тлумачений Н. стає синонімом патріотизму.

Різні автори, відповідно до акцентів в означеннях кожного з цих понять, по-різному окреслюють співвідношення Н. і патріотизму. Деякі теоретики вважають провідною рисою Н. прагнення до національної державності. Так, британський філософ і соціальний антрополог Е. Ґеллнер визначив його як політичний принцип, згідно з яким політична одиниця має збігатися з національною, тобто кожній нації має відповідати держава. Водночас сам цей принцип спирається на уявлення про існування й цінність націй та спільність ключових інтересів їхніх членів. Усвідомлення цього зв’язку привело декого з науковців до ще більшого розширення меж застосування терміна «націоналізм»: вони називають так не лише рішуче обстоювання інтересів нації, а й втілення уявлень про її існування, тяглість і цінність. Британський соціолог М. Білліґ називає таке впровадження банальним Н., протиставляючи його явному, а тим паче агресивному. У період боротьби за національну державність Н. зазвичай декларують в ідеологічних трактатах та політичних програмах, а після створення й усталення держави, він, стаючи дедалі більшою мірою неявним, утілюється у державних і суспільних інституціях.

Незважаючи на деякі розбіжності щодо часу виникнення Н., більшість дослідників пов’язує його початки з переходом від аграрного до індустріального суспільства й зумовленою ним кризою традиційних соціальних зв’язків та ідентичностей, відповіддю на що стала поява нових ідей соціальної організації. Водночас швидке поширення Н. науковці здебільшого датують кін. 18 — поч. 19 ст. і вбачають у цьому вплив Американської революції, а особливо Великої французької революції, що практично втілили засади суверенітету народу й запропонували нову республіканську модель державного ладу, а це зі свого боку призвело до докорінної зміни способів легітимізації та соціалізації, що виявилося, зокрема, в поступовому переході до загальної освіти й виборчого права, розповсюдженні письменності та газет, появі масових партій і громадських організацій, долученні загалу до високої культури й водночас демократизації останньої.

Ці канали розповсюдження національних ідей уможливили прищеплення суспільним «низам», які доти пов’язували себе лише з певною місцевістю й релігією, уявлення про реальність існування націй та свою належність до однієї з них, що й означало творення націй як «уявлених спільнот» (термін американського політолога Б. Андерсона). Згідно з цією конструктивістською концепцією Н., який презентує себе захисником уже чинної нації, насправді її творить. У різних країнах світу Н. розвивався по-різному, відповідно до конкретної політичної, економічної і культурної ситуації. В атлантичному регіоні європейського континенту, де на час появи націоналістичних ідей державні межі загалом збігалися з мовно-етнічними, елітам досить було реорганізувати династійні держави в національні та через їхні інституції поступово впроваджувати національну ідентичність у маси. А втім, досягнути повної однорідності ідентичностей цим державам не вдалося, і пізніше вони зіштовхнулися з низкою викликів з боку Н. периферійних груп, невдоволених своїм економічним становищем та маргіналізацією власних мов і культур. У центральній і східній Європі націоналісти мусили творити на місці багатоетнічних імперій нові держави для своїх етнокультурних націй, які водночас теж треба було частково створити не лише на масовому, а й на елітному рівні, оскільки еліти були значною мірою інкорпоровані в імперські структури. Утвердження націоналістичного світогляду там зазвичай починалося із «винайдення» традиції національного існування, що мала виправдати право на політичну суб’єктність, а отже, державну незалежність. Американські колоністи, які раніше позиціонували себе як частину загальноімперської спільноти, у відповідь на небажання метрополії надати їм більше влади переосмислили себе як окремі національні групи й зажадали незалежності. Натомість у колоніях Азії й Африки творцями й пропагандистами Н. були насамперед освічені вихідці з тубільного населення, які через обмежені можливості успішної кар’єри в колоніальній адміністрації змобілізували проти неї членів своїх дискримінованих етнокультурних груп. У більшості цих країн здобуття незалежності стало не наслідком, а передумовою творення з мовно й навіть расово різнорідних племен модерних націй. У СРСР втілення націоналістичних засад суспільної організації в національно-територіальних автономіях і фіксацію етнічної належності громадян поєднували із забороною політичного і навіть культурного Н. неросійських народів, який, однак, із послабленням тоталітарних режимів став досить потужною політичною силою, що домоглася поділу багатонаціональної держави відповідно до усталених національних меж.

Український Н. тривалий час формувався окремо в різних державах, до яких належали землі з етнічно українською більшістю. Ліберальніший політичний устрій і багатокультурна реорганізація Австро-Угорської імперії уможливили протягом 19 — поч. 20 ст. не лише активну культурницьку діяльність галицьких українських еліт і, дедалі більшою мірою, мас, а й творення етнічно окремішніх громад. організацій та, зрештою, політичних партій, програми яких містили більш чи менш радикальний набір націоналістичних ідей. У міжвоєнний період культурна й економічна дискримінація українців у відродженій Польщі призвела до радикалізації частини галицьких націоналістів і створення ОУН для боротьби з польською владою та поміркованими українськими діячами, які з нею співпрацювали. Самоокреслення ОУН як націоналістичної сили сприяло поширенню серед українців партійного тлумачення Н., за якого діяльність інших партій не спри-ймали як націоналістичну. Під час Другої світової війни ОУН очолила спротив нацистському окупаційному режимові, що увінчався формуванням масової зброй. сили — УПА, яка після звільнення від нацистів майже десятиліття вела боротьбу проти радянської влади. Натомість царський режим Російської імперії упродовж усього 19 ст. забороняв майже будь-яку специфічно українську культурну й тим більше політичну діяльність і намагався зробити українців частиною російської нації, що формувалася. Тільки після Лютневої революції 1917 виникли масові українські політичні партії, що мали виразно націоналістичну орієнтацію, хоча спочатку готові були задовольнитися федералізацією Росії. Після поразки створеної цими партіями УНР у війні з Радянською Росією український Н. протягом 1920-х рр. досить активно розвивався всередині більшовицької партії як домагання української культурної і політичної самостійності у межах СРСР, що стали відомі як український націонал-комунізм.

Подальша політика централізації та русифікації зробила неможливим будь-яке відверте обстоювання національних ідей, тож їхнім єдиним виявом аж до «перебудови» 1980-х рр. була діяльність дисидентів (див. Дисидентський рух), які переважно обмежувалися культурницькими й заг.-демократичними аспектами. Тривала радянська дискредитація поняття Н. налаштувала проти нього більшість населення, тому націоналістичні організації та партії, що знову з’явилися в Україні в останні роки існування СРСР, здебільшого називалися національно-демократичними, а націоналістами визнали себе лише деякі радикальні сили, що залишилися на маргінесі політичного життя. Водночас зумовлена радянською політикою амбівалентність національної свідомості українців суттєво обмежила вплив навіть тих поміркованих націоналістичних партій, що уникали цього окреслення, зокрема Народного руху України. Тому головним чинником Н. є саме існування незалежної держави, інституції якої формують і підтримують національну ідентичність громадян. Проте навіть такий банальний Н. викликає спротив деяких політичних сил, що прагнуть зберегти ідентичність українців як членів східнослов’янської культурної спільноти.

Результати експерименту

Ключові тези статті Націоналізм (відповідь Gemini):

  1. Націоналізм — це багатогранне явище: Стаття підкреслює, що націоналізм — це не просто агресивна ідеологія, а складне поняття, яке охоплює широкий спектр поглядів, від поміркованого патріотизму до крайнього шовінізму.
  2. Націоналізм пов’язаний з державотворчістю: Однією з ключових ідей націоналізму є прагнення до створення національної держави, тобто держави, в якій політична одиниця збігається з національною спільнотою.
  3. Націоналізм — це соціальний конструкт: Націоналізм не є природним станом, а формується в процесі історичного розвитку. Нації — це “уявлені спільноти”, які створюються і підтримуються через різні соціальні інституції.
  4. Націоналізм розвивається в різних історичних та культурних контекстах: Шляхи розвитку націоналізму в різних країнах світу відрізняються залежно від їхньої політичної, економічної та культурної ситуації.
  5. Український націоналізм має свою специфіку: Стаття детально розглядає історію українського націоналізму, підкреслюючи його особливості, пов’язані з багатонаціональним складом українських земель та різними історичними досвідами.

Ключові тези статті Націоналізм (відповідь ChatGPT):

  1. Сутність націоналізму: Націоналізм визначається як почуття, ідеологія та політична дія, що надає найбільшого значення належності людини до нації, і пріоритетним завданням є збереження мови, культури, території та створення власної держави.
  2. Поміркований та агресивний націоналізм: Існує поділ між агресивною, шовіністичною формою націоналізму та поміркованим, який захищає націю як рівну серед інших.
  3. Виникнення націоналізму: Більшість дослідників пов’язує націоналізм із переходом до індустріального суспільства та кризою традиційних соціальних зв’язків, а його поширенням — з кінцем 18 — початком 19 століття.
  4. Творення націй як уявлених спільнот: Через освіту, медіа та інші соціальні інститути національні ідеї впроваджувалися в маси, що створило нові нації як “уявлені спільноти”.
  5. Різний розвиток націоналізму в регіонах: У Західній Європі націоналізм сприяв реорганізації держав, у той час як у Центральній та Східній Європі націоналісти створювали нові держави на основі етнокультурних націй.

ОБГОВОРЕННЯ РЕЗУЛЬТАТІВ

Генеративний штучний інтелект, що став наслідком досягнень у галузі обробки природної мови, здатний не просто створювати тексти, тобто логічно, сенсово поєднувати слова у речення, речення у фрази, надфразові єдності, а й наводити факти, висловлювати аргументи, оперувати даними, опрацьовувати інформацію в різний спосіб, отже, певним чином демонструвати аналог єдності мови і мислення людини. Щоправда, ця його властивість поки що не досконала — багато досліджень, випадкових спостережень засвідчили, що інформація, отримана за допомогою ChatGPT чи інших подібних інструментів, не завжди точна, і рівень довіри до неї закономірно на сьогодні невисокий (Jung et al., 2024).

У значно вигіднішому світлі первинна його функція — створювати тексти, і в цьому сенсі ГШІ успішно використовують в різних видах діяльності. Вище ми згадували про його масове впровадження в інтернет-маркетингу (е-комерції). Варто зазначити й про активне використання ШІ в журналістиці, де йому знайшли застосування не лише у створенні контенту, а й перевірці фактів, обробці даних, генерації зображень, перекладі текстів, зменшуючи навантаження на людину та підвищуючи ефективність результатів журналістської практики (Shi & Sun, 2024). Для окремих репортажів це справжня знахідка. Так, зокрема, вважають деякі науковці, аналізуючи статті, присвячені описові спортивних подій, що ґрунтуються на обробці статистичних показників змагань: за їхніми оцінками, читачі не бачать різниці між статтями про перебіг футбольних матчів, створеними людиною і ГШІ (Rossner et al., 2024). Щоправда, у багатьох інших випадках згенеровані новинні повідомлення викликають занепокоєння щодо точності інформації як базового професійного журналістського стандарту і журналістської етики загалом: “журналістика не може існувати без журналістів” (Peña-Fernández et al., 2023).

Енциклопедична справа має дещо спільне із журналістською. Однак у той час, як питання ШІ в журналістиці висвітлено в багатьох наукових публікаціях, енциклопедознавчих студій з цієї проблематики фактично немає, за винятком тих, що присвячені “Wikipedia” (напр., див. Petroni et al., 2023). Та ще ближче, ніж журналістика, до енциклопедистики стоїть лексикографія, яка давно “мріяла про настання доби електронного словникарства” (de Schryver, 2003). Думки про майбутнє сучасної словникової справи в науковців різні: одні вважають, що лексикографія більше не має майбутнього, адже словникові статті тепер редакція може створювати без участі людини, більше того — віднині фактично з’являється можливість генерувати власні словники онлайн без цілих редакцій і необхідності витрачати на це місяці й роки; інші ж розглядають ГШІ лише як нові можливості й перспективи для подальшого розвитку лексикографії (de Schryver, 2023).

Щоправда, перші тестування ГШІ для автоматизованого виконання типових лексикографічних завдань (розширення корпусу слів, пошук фраз, словоформ, створення дефініцій і прикладів) показують, що ГШІ робить багато помилок, зокрема час від часу генерує галюцинації (цим терміном називають вигадування штучним інтелектом інформації, якої не існує, але яка виглядає правдоподібно), вимагаючи додаткового нагляду, щоб відслідковувати хиби й коригувати їх (McKean & Fitzgerald, 2024). Водночас деякі інші розвідки акцентують, що за потенціалом виконання лексикографічної роботи ГШІ не поступається людині, а тому необхідно шукати правильні шляхи його впровадження у галузь. Наприклад, деякі дослідники провели цікавий експеримент: студентам-медикам пропонували тексти, насичені складними термінами, а далі — проходження тестів на розуміння прочитаного; всіх студентів було розділено на кілька груп — першій разом із текстами давали словничок термінів, дефініції яких попередньо згенерував ChatGPT, другій — медичний термінологічний словник, третя група була без словникових підказок. Результати експерименту показали, що тестування найгірше склала третя група, а перша і друга продемонстрували фактично однаковий результат (контролювали не лише кількість правильних відповідей, а й час, за який пройдено тестування). Дослідники роблять висновок, що з точки зору використання словників на практиці ChatGPT не гірше за людину створює словникові дефініції (Rees & Lew, 2023).

За влучними словами окремих лексикографів, найкращий спосіб визначити, чи корисний ChatGPT або інший генератор текстів для своєї галузі — випробувати його в дії (de Schryver, 2023). Ця рекомендація узгоджується з висновками інших науковців про те, що генеративний штучний інтелект потребує широких досліджень у різних сферах діяльності для з’ясування його ефективності й важливих напрямів упровадження в них (Gupta et al., 2024). У цьому сенсі наше дослідження — одне з перших, що тестує можливість використання ГШІ в енциклопедичній справі як інструмента для підготовки контенту.

Далі схарактеризуємо результати проведеного експерименту. Ознайомившись із текстами, синтезованими штучним інтелектом та при цьому беручи до уваги зміст енциклопедичних статей, констатуємо таке. ГШІ здатен виявляти важливу інформацію в текстах енциклопедичних статей, належно її структурувати, представляти у вигляді логічних, вдало сформульованих текстових конструкцій. При цьому він не використовує будь-яку іншу доступну йому інформацію з теми, а ґрунтується винятково на матеріалі конкретних статей. Уважаємо, що на прикладі обраних текстів із завданням штучний інтелект впорався належним чином. Окремі тези краще виглядають у ChatGPT, деякі — у Gemini. Виразної переваги одного з чат-ботів ми не помічаємо: обидва демонструють більш-менш подібну результативність. Те, що між віртуальними асистентами особливої різниці ми не виявили, помічає багато науковців на прикладі вивчення застосування ШІ в тих чи тих сферах діяльності (напр., див. Rane et al., 2024).

Якість згенерованих текстів залежить від якості авторського контенту: що інформативніше підготовлена стаття, то більш змістовними виглядають тези. У нашому експерименті дві статті мають суттєві відмінності не лише за обсягом, а й за якістю (інформативністю) матеріалу. Стаття про буржуазний націоналізм могла би бути докладнішою, містити більше важливих даних, цікавих фактів, щоб повніше і всебічніше окреслити це явище. Недоліки статті зумовлені як прорахунками редакції щодо вибору автора, так і недостатнім на той час досвідом такої роботи.

Із цього приводу (йдеться про набуття досвіду енциклопедичними редакціями) цікавими вважаємо спостереження дослідників про те, що зазвичай робота над першими томами виходить більш спланована порівняно з іншими. Зокрема, досвід укладання європейських енциклопедій 19 ст. свідчить: томи на перші літери підготовлено більш дбайливо щодо написання статей (Loveland, 2019). Цей же дослідник звертає увагу й на певну диспропорцію між реєстром гасел на перші літери, де зосереджено найбільше різноманіття гасел, та на решту: наприклад, в “Encyclopédie nouvelle” (1834–42) перший том присвячено єдиній літер “A”, останній том — цілій низці літер від “S” до “Z” (Loveland, 2019, 130).

Досвід української енциклопедистики певною мірою корелює з європейською, адже маємо випадки, коли багатотомний енциклопедичний проєкт не завершили або лише розпочали, видавши 1–2 томи, не поодинокі приклади, коли останні томи зроблено нашвидкуруч. Оскільки реалізація багатотомних енциклопедичних проєктів — це справа одного чи навіть кількох десятиліть, то є багато чинників, що зумовлюють диспропорцію у кількості статей поміж першими й останніми томами, різна кількість залучених авторів, а часто й різний рівень їхньої фахової підготовки. На прикладі створення “Енциклопедії Сучасної України” засвідчуємо, що участь у підготовленні статей для перших томів взяла значно більша кількість авторів, ніж для решти, серед причин — втрата ентузіазму авторів, що спричинено не лише відсутністю оплати за написання статті, а й довгим очікуванням виходу її друком (зазвичай редакція видавала один том на рік).

Нині ж загальна цифровізація суспільства й відкритий доступ до інформації, поява “Вікіпедії” та інші чинники в сукупності пригнічують мотивацію фахівців долучатися до класичних енциклопедичних проєктів. А це означає, що енциклопедичні редакції можуть почати вдаватися до ГШІ для підготовки енциклопедичних статей. Зауважимо, що нині відсутні правила відповідального використання ГШІ в енциклопедичній галузі. Отже, це питання потребує окремої серйозної наукової дискусії, вироблення загальної позиції енциклопедистів, їхнього етичного розуміння щодо залучення штучного інтелекту до продукування енциклопедичного контенту замість авторського, що, власне, означало б генерацію знань замість постачання знань, вплив на “інформаційну екосистему та інфраструктуру знань” (Bentzen 2023), підважування статусу енциклопедій як надійних джерел.

ВИСНОВКИ

У дослідженні зроблено спробу перевірити можливості генеративного штучного інтелекту узагальнювати інформацію з енциклопедичних статей, виділяти в них ключові елементи, конспектувати їхній зміст.

Подібні текстові блоки як додатковий контент могли б доповнювати статті онлайн-енциклопедій. Це сприяло б посиленню інтересу до енциклопедій, робило б їх більш привабливими для користувачів, підвищувало б рівень сприйняття і засвоєння інформації у них. Особливо це було б корисно для розлогих статей або таких, що містять складний для пересічного читача матеріал.

Результати дослідження свідчать, що генеративний штучний інтелект здатний виконувати такі завдання. Це, зокрема, випливає з експериментів, проведених на основі двох статей “Енциклопедії Сучасної України”. Віртуальні помічники ChatGPT та Gemini згенерували ключові тези до них, які авторами цієї статті, що мають досвід укладання ЕСУ та інших енциклопедично-словникових видань, були оцінені позитивно.

Така позитивна оцінка навіює на думку, що генеративний штучний інтелект міг би добре впоратися і з написанням енциклопедичних статей. Проблема з пошуку автора енциклопедичної статті завжди була важлива, а нині одна з ключових. Водночас наголошено, що, на думку авторів, подібна практика була б зловживанням в енциклопедичній практиці, знецінювала б енциклопедичні видання. Відтак констатовано про необхідність започаткування дискусії серед енциклопедистів щодо певних правил етичного застосування генеративного штучного інтелекту в своїй галузі.

ПРИМІТКИ

1https://esu.com.ua/article-38057

2https://esu.com.ua/article-71080

ЛІТЕРАТУРА

Андрієвська, В. (2018). Ключові напрями розвитку освіти в інформатизованому суспільстві. Вісник Чернігівського національного педагогічного університету імені Т. Г. Шевченка. Педагогічні науки, 153, 3-6.

Google Scholar

Близнюк, Т. (2017). Перспективи використання інформаційних та комунікаційних технологій у гірських школах Українських Карпат. Гірська школа Українських Карпат, 17, 69-72. https://doi.org/10.15330/msuc.2017.17.69-72

Google Scholar

Железняк М., Іщенко О. (2021). Онлайн-енциклопедії США як сучасні освітні ресурси. Інформаційні технології і засоби навчання, 84(4), 339-353. https://doi.org/10.33407/itlt.v84i4.4410

Google Scholar

Сербін, В. (2023). Штучний інтелект як інструмент створення динамічних описів товарів в електронній комерції. Маркетинг і цифрові технології, 7(4), 79-94. https://doi.org/10.15276/mdt.7.4.2023.5

Google Scholar

Bentzen, N. (2023). Opskrbni lanci znanja u vremenu propadanja istine. Studia Lexicographica, 17(32), 143-152. https://doi.org/10.33604/sl.17.32.5 

Google Scholar

De Schryver, G. (2003). Lexicographers’ dreams in the electronic‐dictionary age. International journal of lexicography, 16(2), 143-199.

Google Scholar

De Schryver, G. (2023). Generative AI and Lexicography: The Current State of the Art Using ChatGPT. International Journal of Lexicography, 36(4), 355–387. https://doi.org/10.1093/ijl/ecad021

Google Scholar

Gupta, P., Ding, B., Guan, C., & Ding, D. (2024). Generative AI: A systematic review using topic modelling techniques. Data and Information Management, 100066. https://doi.org/10.1016/j.dim.2024.100066

Google Scholar

Jovanovic, M., & Campbell, M. (2022). Generative Artificial Intelligence: Trends and Prospects. Computer, 55(10), 107-112. https://doi.org/10.1109/mc.2022.3192720

Google Scholar

Jung, Y., Chen, C., Jang, E., & Shyam S. (2024). DoWe Trust ChatGPT as much as Google Search and Wikipedia? In Proceedings of the Conference on Human Factors in Computing Systems (p. 1-9). Association for Computing Machinery. https://doi.org/10.1145/3613905.365086

Google Scholar

Loveland, J. (2019). The European Encyclopedia: From 1650 to the Twenty-First Century. Cambridge: Cambridge University Press. https://doi.org/10.1017/9781108646390

Google Scholar

McKean, E., & Fitzgerald, W. (2024). The ROI of AI in lexicography. Lexicography. https://doi.org/10.1558/lexi.27569

Google Scholar

Peña-Fernández, S., Meso-Ayerdi, K., Larrondo-Ureta, A., & Díaz-Noci, J. (2023). Without journalists, there is no journalism: the social dimension of generative artificial intelligence in the media. El Profesional De La Informacion. https://doi.org/10.3145/epi.2023.mar.27

Google Scholar

Petroni, F., Broscheit, S., Piktus, A., Lewis, P., Izacard, G., Hosseini, L., Dwivedi-Yu, J., Lomeli, M., Schick, T., Bevilacqua, M., Mazaré, P., Joulin, A., Grave, E., & Riedel, S. (2023). Improving Wikipedia verifiability with AI. Nature Machine Intelligence, 5(10), 1142–1148. https://doi.org/10.1038/s42256-023-00726-1

Google Scholar

Rees, G. P., & Lew, R. (2023). The Effectiveness of OpenAI GPT-Generated Definitions Versus Definitions from an English Learners’ Dictionary in a Lexically Orientated Reading Task. International Journal of Lexicography. https://doi.org/10.1093/ijl/ecad030

Google Scholar

Rane, N., Choudhary, S., & Rane, J. (2024). Gemini versus ChatGPT: applications, performance, architecture, capabilities, and implementation. Journal of Applied Artificial Intelligence, 5(1), 69–93. https://doi.org/10.48185/jaai.v5i1.1052

Google Scholar

Rossner, A., Cassel, M., & Huschens, M. (2024). Do users really care? Evaluating the user perception of disclosing AI-Generated content on credibility in (Sports) journalism. In MuC ’24: Proceedings of Mensch Und Computer 2024, 35, 413-418. https://doi.org/10.1145/3670653.3677490

Google Scholar

Shi, Y., & Sun, L. (2024). How Generative AI Is Transforming Journalism: Development, Application and Ethics. Journalism and Media, 5(2), 582–594. https://doi.org/10.3390/journalmedia5020039

Google Scholar

Це стаття відкритого доступу, її розміщено на умовах ліцензії Creative Commons Attribution CC BY 4.0, що надає читачеві право поширювати чи використовувати у власних потребах авторський матеріал за умови належного цитування статті.

© М. Железняк, О. Іщенко, 2024. Опубліковано Інститутом енциклопедичних досліджень НАН України.

Повна версія сторінки