Вергун А. Р., Ягело С. П., Макагонов І. О., Шалько І. В., Кіт З. М., Вергун О. М., Ютанова А. В. Антиплагіатна стратегія експертизи наукових праць студентів та молодих вчених з одномоментною перевіркою декількох тез доповідей без втрати валідності з застосуванням Інтернет-ресурсів // Міжнародний науковий журнал "Інтернаука". — 2018. — №6.
Педагогічні науки
УДК 004.03+001.9
Вергун Андрій Романович
старший інспектор наукового відділу, антиплагіатний експерт
наукових публікацій та дисертаційних матеріалів,
кандидат медичних наук, доцент кафедри сімейної медицини,
Львівський національний медичний університет імені Данила Галицького
Вергун Андрей Романович
старший инспектор научного отдела, антиплагиатный эксперт
научных публикаций и диссертационных материалов,
кандидат медицинских наук, доцент кафедры семейной медицины
Львовский национальный медицинский университет имени Данила Галицкого
Vergun Andrіy
Senior Inspector of the Scientific Department,
Anti-Plagiarism Expert of the Scientific Publications and Dissertation Materials,
PhD, Associate Professor of Family Medicine
Danylo Halytsky Lviv National Medical University
Ягело Світлана Петрівна
вчений секретар, асистент кафедри українознавства
Львівський національний медичний університет імені Данила Галицького
Ягело Светлана Петровна
ученый секретарь, ассистент кафедры украиноведения
Львовский национальный медицинский университет имени Данила Галицкого
Yagelo Svіtlana
Scientific Secretary, Assistant Professor of the Ukrainian Studies Department
Danylo Halytsky Lviv National Medical University
Макагонов Ігор Олександрович
кандидат медичних наук, доцент кафедри сімейної медицини
Львівський національний медичний університет імені Данила Галицького
Макагонов Игорь Александрович
кандидат медицинских наук, доцент кафедры семейной медицины
Львовский национальный медицинский университет имени Данила Галицкого
Makahonov Іgor
PhD, Associate Professor of Family Medicine
Danylo Halytsky Lviv National Medical University
Шалько Ірина Володимирівна
кандидат медичних наук, доцент кафедри сімейної медицини
Львівський національний медичний університет імені Данила Галицького
Шалько Ирина Владимировна
кандидат медицинских наук, доцент кафедры семейной медицины
Львовский национальный медицинский университет имени Данила Галицкого
Shalko Іryna
PhD, Associate Professor of Family Medicine
Danylo Halytsky Lviv National Medical University
Кіт Зоряна Михайлівна
кандидат медичних наук, доцент кафедри сімейної медицини
Львівський національний медичний університет імені Данила Галицького
Кит Зоряна Михайловна
кандидат медицинских наук, доцент кафедры семейной медицины
Львовский национальный медицинский университет имени Данила Галицкого
Kіt Zoryana
PhD, Associate Professor of Family Medicine
Danylo Halytsky Lviv National Medical University
Вергун Оксана Михайлівна
кандидат медичних наук, доцент кафедри терапії №1
та медичної діагностики ФПДO
Львівський національний медичний університет імені Данила Галицького
Вергун Оксана Михайловна
кандидат медицинских наук, доцент кафедры терапии №1
и медицинской диагностики ФПДO
Львовский национальный медицинский университет имени Данила Галицкого
Vergun Oksana
PhD, Associate Professor of the Department of Therapy № 1
and Medical Diagnostics FPGE
Danylo Halytsky Lviv National Medical University
Ютанова Алла Володимирівна
кандидат медичних наук, доцент кафедри сімейної медицини
Львівський національний медичний університет імені Данила Галицького
Ютанова Алла Владимировна
кандидат медицинских наук, доцент кафедры семейной медицины
Львовский национальный медицинский университет имени Данила Галицкого
Yutanova Alla
PhD, Associate Professor of Family Medicine
Danylo Halytsky Lviv National Medical University
АНТИПЛАГІАТНА СТРАТЕГІЯ ЕКСПЕРТИЗИ НАУКОВИХ ПРАЦЬ СТУДЕНТІВ ТА МОЛОДИХ ВЧЕНИХ З ОДНОМОМЕНТНОЮ ПЕРЕВІРКОЮ ДЕКІЛЬКОХ ТЕЗ ДОПОВІДЕЙ БЕЗ ВТРАТИ ВАЛІДНОСТІ З ЗАСТОСУВАННЯМ ІНТЕРНЕТ-РЕСУРСІВ
АНТИПЛАГИАТНАЯ СТРАТЕГИЯ ЭКСПЕРТИЗЫ НАУЧНЫХ РАБОТ СТУДЕНТОВ И МОЛОДЫХ УЧЕНЫХ С ОДНОМОМЕНТНОЙ ПРОВЕРКОЙ НЕСКОЛЬКИХ ТЕЗИСОВ ДОКЛАДОВ БЕЗ ПОТЕРИ ВАЛИДНОСТИ С ПРИМЕНЕНИЕМ ИНТЕРНЕТ-РЕСУРСОВ
ANTIPLAGIARISM STRATEGIES OF STUDENTS SCIENTIFIC AND YOUNG SCIENTISTS WORKS EXAMINATION WITH ONE-STAGE CHECK OF SEVERAL ABSTRACTS WITHOUT LOSS OF VALIDITY WITH THE USE OF INTERNET RESOURCES
Анотація. Пропонується алгоритм оптимізації антиплагіатної експертизи наукових праць студентів та молодих вчених з одномоментною перевіркою декількох тез доповідей без втрати валідності шляхом одномоментного послідовного застосування двох програм десктопного програмного забезпечення та антиплагіатних інтернет-ресурсів.
Ключові слова: антиплагіатна перевірка, авторський алгоритм.
Аннотация. Предлагается алгоритм оптимизации антиплагиатной экспертизы научных работ студентов и молодых ученых с одномоментной проверкой нескольких тезисов докладов без потери валидности путем одномоментного последовательного применения двух программ десктопного программного обеспечения и антиплагиатных интернет-ресурсов.
Ключевые слова: антиплагиатная проверка, авторский алгоритм.
Summary. The algorithm of optimization of antiplagiarism examination of scientific works of students and young scientists with one-stage verification of several abstracts without loss of validity is offered by simultaneous sequential application of two desktop programs of software of antiplagiarism Internet resources.
Key words: plagiarism detection, author's algorithm.
Постановка проблеми у загальному вигляді і її зв’язок з важливими науковими та практичними завданнями. Відповідно до ст. 32 Закону України «Про вищу освіту» вищі навчальні заклади зобов’язані вживати заходи, запроваджувати відповідні новітні технології для запобігання та виявлення академічного плагіату в роботах наукових, науково-педагогічних, педагогічних, інших працівників, здобувачів наукового ступеня і студентів (зокрема кваліфікаційних робіт магістрів) усіх форм навчання [1-3]; розвитку навичок коректної роботи із джерелами інформації; дотримання вимог наукової етики та поваги до інтелектуальних надбань; активізації самостійності й індивідуальності при створенні авторських творів і відповідальності за порушення загальноприйнятих правил цитування [1, 6]. Експертна оцінка наукових праць є важливою передумовою адекватності реалізації комплексних наукових тем вищих навчальних закладів та об’єктивізує загальну оцінку якості представлення результатів досліджень у фахових та інших наукових виданнях, включаючи тези доповідей наукових конференцій.
Аналіз останніх досліджень, у яких започатковано вирішення проблеми. Наукові дослідження щодо можливостей протидії та виявлення плагіату є актуальною проблемою, що має не лише академічний та юридичний, але також економічний та соціокультурний контексти. Плагіат у перекладі з грецької означає «крадіжка», що розкриває лише частково суть цього явища [2]. На перший погляд, плагіат не здається настільки серйозною проблемою [1-3, 6]. У академічному середовищі довгий час “робили вигляд”, що не помічають цю проблему, або вважали її не настільки серйозною [1, 2]. Тепер, у контексті академічної доброчесності, більшість провідних вищих навчальних закладів прискіпливіше ставляться до рівня свого престижу і вбачають одним із найважливіших завдань боротьбу з плагіатом. Плагіат несе шкоду не лише науковій спільноті, хоча, насамперед, від нього страждають наука та освіта [2, 4, 6]. «Репліки» наукових праць та результатів наукових досліджень так чи інакше знижують якість освіти та професійної підготовки фахівців будь-якої галузі. Задля цього програмне забезпечення (ПЗ) для перевірки робіт на наявність плагіату повинно увесь час удосконалюватись та ставати доступним для кінцевого користувача [2]. Перевірка тез доповідей та статей у фахові журнали здійснюється за допомогою програм «Advego Plagiatus», «AntiPlagiarism.NET» або «Etxt Антиплагиат». На сайті Наукової бібліотеки Чернівецького національного університету імені Юрія Федьковича у матеріалі під назвою «Впровадження системи антиплагіату в ЧНУ» представлено 12 видів плагіату: «републікація, реплікація, рерайт, фальсифікація, дослівний плагіат, мозаїчний плагіат, відсутність посилань на прямі цитати, неадекватне перефразування, поєднання власного та запозиченого тексту без цитування джерел, копіювання чужої наукової роботи та привласнення результатів праці, списування письмових робіт інших студентів, згадування джерел без посилання» [3]. Незважаючи на те, що доповіді про виконаних наукових робіт заслуховуються на засіданнях профільних кафедр (лабораторій), враховуючи велику кількість тез доповідей, що скеровуються кафедрами для публікації, процес їх технічної перевірки стандартним способом (екстенсивним, послідовним) потребує значних затрат часу. Тому актуальним є проблема оптимізації перевірки таких праць шляхом впровадження нових алгоритмів з комплексним застосуванням як онлайн-ресурсів [2], так і десктопного програмного забезпечення [5, 8, 9]. Система запобігання академічному плагіату включає інструкції, процедури та заходи з формування несприйняття академічної нечесності; створення умов, що унеможливлюють академічний плагіат; виявлення копіпастів та реплік в наукових статтях, монографіях, дисертаціях, підручниках, навчальних виданнях; відповідальність за академічний плагіат. Антиплагіатна експертиза є невід’ємною складовою системи внутрішньвузівського забезпечення якості освітньої та наукової діяльності та якості вищої освіти [2, 3, 14].
У Львівському національному медичному університеті імені Данила Галицького антиплагіатна експертиза функціонує з 2015 р. Працівниками наукового відділу ВУЗу проводяться активні дослідження щодо впровадження сучасного програмного забезпечення та оптимізації проведення перевірки зі збереженням її ефективності та валідності в контексті академічної доброчесності наукових досліджень [5, 6, 11].
Після перевірки на плагіат наукової роботи відповідальний експерт надає висновок у вигляді довідки про проведення первинної експертизи з указанням відсотку унікальності (оригінальності) текстових даних у представленій роботі особисто автору або через електронну почту [5]. Пошук в Інтернеті здійснюється декількома пошуковими системами [6, 11]. В результаті візуалізується відсоток оригінальності тексту та список сайтів з відсотком збігу у відповідному кольорі в залежності від застосованих пошукових серверів [7].
Мета роботи. Оптимізація стратегії первинної технічної антиплагіатної перевірки малооб’ємних публікацій – наукових праць (тез доповідей на конференції студентів та молодих вчених) зі збільшенням швидкості проведення технічної перевірки без втрати якості її виконання шляхом впровадження авторського алгоритму антиплагіатної експертизи з одномоментною перевіркою 7 тез доповідей без втрати валідності шляхом одномоментного послідовного застосування двох програм загальнодоступного десктопного програмного забезпечення та інтернет-ресурсів.
Виклад основного матеріалу дослідження з повним обґрунтуванням отриманих наукових результатів. Стратегія антиплагіатної експертизи реалізується застосуванням вільнодоступного програмного забезпечення та інтернет-ресурсів. Згідно з внутрішньовузівським Положенням про перевірку результатів наукових досліджень на наявність плагіату, тотальна експертиза проводиться для вільнодоступних, оптимізованих щодо аналізу (незахищених паролем) електронних варіантів тез доповідей, представлених у форматах: *.txt, *.rtf (Rich Text Format), *.doc (Word 97 − Word 2003),*.docx, *.docm (Word 2007-2010), *.pdf (Portable Document Format), *.odf, *.odt (Open Text Document).
Наукова робота вводиться в електронну систему програмного забезпечення антиплагіатної експертизи повністю для визначення загального відсотку унікальності (оригінальності) текстових даних у представленій роботі. Перевірка та пошук співпадінь виконується по шинглах (методом шингл-розбивки тексту). Шингл – структурно-логічний фрагмент тексту, що складається з послідовності декількох слів [6]. Аналіз тексту на копіпаст (копії), рерайт (переписування), пошук плагіату (привласнення) [1, 4, 5] здійснюється за допомогою пошукових систем Google, Yahoo, Bing, Nigma та ін [2].
Найбільш адекватним ПЗ для експертизи коротких текстів – студентських наукових праць вважається «Advego Plagiatus» [5, 6, 8, 9], версії 1.3.1.7. – 1.3.3.2. – безкоштовна програма, якою можна перевірити тези, статтю або будь-який текст на унікальність. За принципом роботи майже не відрізняється від інших антиплагіатних програм, проте працює дещо стабільніше, об’єктивність пошуку залежить від адекватності налаштувань [2].
У результаті перевірки система надає адекватний звіт подібності, який дозволяє швидко оцінити оригінальність перевіреного тексту, що має значення в контексті стратегії академічної доброчесності. На запропонований нами алгоритм антиплагіатної експертизи отримано свідоцтво про раціоналізаторську пропозицію, текстова версія заяви та повного алгоритму експертизи депонована у науковій бібліотеці Львівського національного медичного університету імені Данила Галицького 20.03.2018 р.
Одномоментна перевірка 7 тез доповідей нами реалізується шляхом десктопного завантаження у попередньо відкриті діалогові вікна вільнодоступного ПЗ [4], скринінгу 5 тез доповідей у 5 діалогових вікнах десктопної програми «Advego Plagiatus» та 2 доповідей – у інтернет ресурсах Сontent Watch» та «Вe1Ru» після попередньої реєстрації. Відповідальний за автоматичну перевірку наукових текстів та дисертаційних матеріалів вводить текст роботи в електронну систему програмного забезпечення антиплагіатної експертизи та перевіряє її на наявність плагіату. При сумнівних результатах перевірки антиплагіатними інтернет-ресурсами (онлайн), здійснюється повторна валідизаційна перевірка цих тез у попередньо відкритих та підготовлених діалогових вікнах «Etxt Антиплагиат» («AntiPlagiarism.NET») згідно з запропонованим алгоритмом (рис. 1).
Рис. 1. Авторський алгоритм одномоментної перевірки 7 тез доповідей студентських наукових праць шляхом одномоментного застосування діалогових вікон десктопної програми «Advego Plagiatus» та у інтернет ресурсів Сontent Watch» та «Вe1Ru» з валідизаційною перевіркою сумнівних робіт у попередньо відкритих та підготовлених діалогових вікнах «Etxt Антиплагиат» («AntiPlagiarism.NET»)
У рамках комплексної стратегії академічної доброчесності та тотальної антиплагіатної експертизи публікацій результатів наукових досліджень нами здійснено перевірку наукових праць – 480 тез доповідей студентів та молодих вчених, що були представлені для участі у науковій конференції Львівського національного медичного університету імені Данила Галицького у 2018 р. За запропонованим алгоритмом здійснена вибіркова перевірка 150 тез доповідей студентської наукової конференції Львівського національного медичного університету імені Данила Галицького, внаслідок наявності академічного плагіату відхилено 7 праць (4,7%). Після повторної перевірки програмою «Etxt Антиплагиат» 12 сумнівних робіт (8%), кількість відхилених внаслідок наявності академічного плагіату тез доповідей збільшилася та становила 11 праць (7,33%).
Загальний текст у «AdvegoPlagiatus» ділиться на фрази, а потім відбувається пошук подібних фраз в Інтернеті через пошукові сервери. Якщо фраза знайдена в Інтернеті, то вона вважається неоригінальною й підсвічується жовтим кольором. Основним недоліком є наявність обмеження тексту до 200000 символів. До можливостей «Advego Plagiatus» відноситься: перевірка в Інтернеті неопублікованих матеріалів; перевірка в інтернеті опублікованого матеріалу; показ сайтів, на яких знайдені текстові співпадіння; два ступені перевірки тексту: «Перевірити унікальність» і «Глибока перевірка»; доступна функція: «Прибрати теги»; «підсвічування» не унікальних частин тексту [8]. Програма має вбудований редактор, який містить необхідні базові функції для редагування тексту. У «Advego Plagiatus» є можливість вибирати пошукові системи, швидку або глибоку перевірку, ігнорувати будь-якої домен, вибирати та налаштувати кількість слів у пошуковій фразі і розмір шингла, задати в відсотках поріг збігів, перевірити унікальність контенту за визначеною URL-адресою [9]. У 2017 р. вийшла нова версія «Advego Plagiatus» – 1.3.3.2, у якій було змінено алгоритми роботи з усіма пошуковими системами, кількість запитуваних пошуковими системами «капч» зменшено в декілька разів, програма використовує весь стандартний «набір» пошукових систем [8]. Оптимізована швидкість роботи сервісу. Вирішено питання з некоректною обробкою деяких капч сервісом Антігейт. Змінено дефолтний (він же рекомендований) список пошукових систем. Удосконалений алгоритм пошуку джерел рерайтингу і лексичних збігів. Результатом роботи програми є два параметри: "пошук по фразах" і "пошук за словами". При появі великої кількості блокувань від системи пошуку Nigma допустиме її відключення в налаштуваннях [8, 9]. Переривання: «0» (якщо необхідно дізнатися сам факт неунікальності; без докладного вивчення документа, можливо встановити значення рівним «50»); Збіги: від 1%; Шингл: 4; Фраза: 4; Таймаут: на швидкому інтернеті – 10 секунд, на повільному – 50 секунд; Розмір 1000 кб [10]. Нами стверджено, що дані параметри дозволяють застосовувати одночасну перевірку системою до 5 коротких наукових праць (до 10000 символів), – кожної зокрема в окремому діалоговому вікні [5, 6, 11]. Проте повільність роботи цієї програми детермінує можливість одночасного застосування для паралельної експертизи інших 2 тез доповідей інших антиплагіатних програм, включаючи інтернет – ресурси, оптимальними з яких на сьогоднішній день являються «Сontent Watch» [12] та «Вe1Ru» [13]. За допомогою складного алгоритму програмні роботи ділять текст на логічні фрази, онлайн визначають контентні частини та їх авторство. Важливою функцією є виділення кольором і розміром слів, співпадіння яких в тексті вище 5%. Оптимальним значенням вживання в тексті повторюваних слів (з урахуванням словоформ) прийнято вважати 3-4%. Якщо унікальність становить 90-100%, то такий текст є повністю унікальний – наявна “еталонна” унікальність контенту. При 80-90% – текст достатньо унікальний, стверджується добра унікальність контенту. 70-80% – текст є допустимо унікальний, наявна нормальна – задовільна унікальність контенту [13]. Для наукових праць допускається 70% та вище унікальності тексту [13, 14]. При наявності сумнівного результату експертиз (неправдоподібно великого або низького відсотку унікальності) для валідизації результатів сумнівні тез, згідно із запропонованим нами алгоритмом перепровіряються програмою «Etxt Антиплагиат» (комерційна версія «AntiPlagiarism.NET»). Програми «Etxt Антиплагиат» та «AntiPlagiarism.NET» дозволяють перевіряти написані тексти, всі сторінки потрібного сайту, та вести пакетну перевірку всіх файлів з папки. Для того, щоб не здійснювати завантаження файлів по одному, існує пакетна перевірка. Пакетна перевірка дозволяє завантажити до програми «Etxt Антиплагиат» (налаштування програми «Anti Plagiarism.NET» є аналогічним) папку з файлами для одночасної перевірки. Для перевірки тексту потрібно вставити його у віконце сервісу, і натиснути кнопку «Перевірити на унікальність». Інтерфейс цих програм є зрозумілим і зручним, десктопним ПЗ адекватно розпізнається не унікальний текст [7, 11]. Недоліки – можливі «зависання» («AntiPlagiarism.NET», як комерційна версія, є більш стабільною у роботі). Повільність роботи та достатньо висока частота програмних збоїв не дозволяє застосовувати «Etxt Антиплагиат» для основної перевірки декількох тез доповідей [2, 5], проте дане ПЗ добре зарекомендувало себе для валідизації сумнівних результатів, що враховано у нашому алгоритмі.
Тривалість перевірки одного логічного блоку (7 праць становила 10-17 хвилин, середня тривалість – 12 хвилин). При послідовній перевірці 7 студентських тез екстенсивним «стандартним» способом десктопною програмою «Advego Plagiatus, версія 1.3.3.2» така перевірка тривала до 1,5 год (70-90 хвилин). Таким чином, запропонований алгоритм дозволяє здійснити економію 81,11% – 85,71% затрат ефективного часу без втрати результативності антиплагіатної первинної технічної експертизи тез доповідей.
Висновки. У рамках стратегії академічної доброчесності згідно внутрішньовузівського Положення про антиплагіатну експертизу нами запропоновано та впроваджено у Львівському національному медичному університеті імені Данила Галицького алгоритм оптимізації швидкості виконання первинної технічної антиплагіатної перевірки коротких студентських наукових праць (тез доповідей конференцій студентів та молодих вчених) без втрати якості її виконання шляхом послідовного та одномоментного застосування декстопних програм «Advego Plagiatus», «Etxt Антиплагиат» («AntiPlagiarism.NET») та інтернет-ресурсів «Сontent Watch» та «Вe1Ru». Наведені результати апробації алгоритму дозволяють рекомендувати оптимізацію антиплагіатної експертизи наукових праць студентів та молодих вчених з одномоментною перевіркою 7 тез доповідей із застосуванням антиплагіатних інтернет-ресурсів, що дозволяє здійснити економію 81,11% – 85,71% затрат ефективного часу без втрати експертної валідності для застосування у наукових відділах вищих навчальних закладів, відділах інформації наукових бібліотек та структурних підрозділах науково-дослідних інститутів та інших навчальних установ.
Література