Российская система сможет определять плагиат в сфере IT

shishkin 03.12.2022 Комментариев нет

Точно определять плагиат в сфере компьютерных программ и вычислять программистов-вирусописателей станет возможно при помощи интеллектуальной системы из ТУСУРа, уверены разработчики. Результаты исследований опубликованы в журнале Future Internet.

Проблема борьбы с плагиатом программного обеспечения и использования чужих наработок в собственном продукте особенно актуальна в IT-индустрии. Новые варианты ее решения позволяют сократить время выявления случаев подобных краж, пояснили в Томском государственном университете систем управления и радиоэлектроники (ТУСУР).»В основе любой программы лежит исходный код, представленный в виде текста, написанный на одном из языков программирования. Языки состоят из различных синтаксических наборов правил и комбинаций знаков. Большинство случаев плагиата подразумевают использование чужих наработок», – пояснили в вузе.

Для эффективного выявления злоумышленников и упрощения решений спорных ситуаций о принадлежности интеллектуальной собственности специалисты ТУСУРа создали систему для точного определения авторства в программных (исходных) кодах.

Российская система сможет определять плагиат в сфере IT

«Разработанная методика анализа учитывает все особенности исходных кодов программ. Это стало возможно благодаря авторской глубокой нейронной сети, позволяющей находить признаки авторского стиля программирования даже в самых сложных случаях», – рассказал старший научный сотрудник НИЦ «Интеллектуальные системы доверенного взаимодействия» ТУСУРа Александр Романов.

«Системы искусственного интеллекта, определяющие авторство текстов, пол, возраст и настроение автора с высокой точностью, давно стали реальностью. Однако разработка университета позволяет «вычислить» автора программы по исходному коду»,– продолжил Романов.

Он подчеркнул, что другие современные решения имеют ряд серьезных ограничений, обоснованных как языками программирования, так и необходимым для эффективного анализа объемом данных.

Российская система сможет определять плагиат в сфере IT

«Более того, предлагаемая методика позволяет анализировать не только созданные человеком исходные коды, но также и сгенерированные машиной, разделять авторство между ними, выявлять отличительные особенности каждой отдельно взятой генеративной модели», – добавил ученый.

Для ситуаций, когда программист владел двумя языками программирования, средняя точность определения авторства составила 87%, тремя и более – 76%, а в случае анализа искусственно-сгенерированного кода – 81,5%, отметили в университете.

По словам Александра Романова, на следующем этапе ученые планируют исследовать исполняемые файлы программ, содержащие команды, представленные в виде машинного кода, с целью определения авторства скомпилированного исходного кода. Это поможет выявлять программистов – авторов компьютерных вирусов.

Российская система сможет определять плагиат в сфере IT

Работы по данному направлению предусмотрены в стратегическом проекте Программы развития вуза до 2030 года, который реализуется в рамках государственной программы Минобрнауки «Приоритет-2030».

Добавить комментарий Отменить ответ