proces zberu a overovania prác

Report
Centrálny register záverečných prác v SR
a kontrola originality dokumentov
ako centrálne poskytovaná služba
Juraj Noge
CVTI SR, Bratislava
[email protected]
CASLIN 2011, 12. – 15.6. 2011
OBSAH








Zopár slov o plagiátorstve na úvod
Etapy riešenia CRZP a APS
Proces zberu a overovania prác
Stručný popis technického riešenia
Čísla a štatistiky
Ohlasy, prínosy a hodnotenie po prvom roku
Perspektíva ďalšieho rozvoja
Záver
ÚVOD
 Plagiátorstvo ako celospoločenský fenomén
 Problém neoprávneného preberania resp.
napodobovania výsledkov cudzej duševnej
činnosti
V súčasnosti ho uľahčuje najmä:
 Dostupnosť informačno-komunikačných
technológií prakticky pre každého
 Dramatický rast obsahu, ktorý je dostupný
cez Internet
ÚVOD
 Plagiátorstvo prináša nezaslúžený profesný,
spoločenský, ale nezriedka i finančný benefit
 Najvypuklejšie v oblasti školstva
 Môže kaziť dobré meno inštitúcie, v ktorej sa
práca obhájila
Riešenia v SK:
 Na lokálnej úrovni
 Komplexné riešenie na celoslovenskej úrovni
včítane centrálneho úložiska všetkých prác
ETAPY RIEŠENIA
Úvodná analyticko – koncepčne - organizačná
etapa – r. 2009:
 Riešila centrálne úložisko všetkých
záverečných a kvalifikačných prác
 MŠ SR – iniciátor a zastrešovateľ
 Realizovaná pod gesciou UKF v Nitre
 SVOP, s.r.o – vybraná ako externý dodávateľ
1. ETAPA
Činnosti počas 1. etapy riešenia:
 Identifikácia východiskového stavu
 Navrhla sa koncepcia, ktorá riešila:
• Legislatívu
• Problematiku autorských práv a licenčných
zmlúv na diela
• Finančné a organizačné zabezpečenia
projektu v celej jeho šírke pôsobenia
• identifikáciu logistiky a dopadov na
akademické informačné systémy a pod.
1. ETAPA
Konkrétne napr:
• vydanie Metodického usmernenia MŠ SR č,
14/2009
• Novela VŠ zákona s účinnosťou od 1.1.2010
a pod.
• Pripravila sa koncepcia technického
riešenia samotného
2. ETAPA
2. etapa riešenia – implementácia CRZP:
 Implementácia CRZP:
• Technický návrh riešenia
• Vývoj programového vybavenia
• Vybudovanie technickej infraštruktúry
• Inštalovanie potrebného SW vybavenia
u prevádzkovateľa ako i na VŠ
• Testovacie práce
2. ETAPA
 Dobudovanie požadovanej infraštruktúry
na strane vysokých škôl v súvislosti
s exportom prác do centrálneho registra
 Testovanie funkcionality prenosových
rozhraní medzi centrálnym registrom a AIS
 Príprava pokynov, vysvetlení a pod.,
súvisiacich s prijatou právnou normou
 Zmena prevádzkovateľa - ministerstvom
priamo riadená organizácia - CVTI SR so
sídlom v Bratislave
3. ETAPA
3. etapa riešenia – implementácia APS:
 Antiplagiátorský systém – nadstavba CRZP
 Obstarávateľ CVTI SR
 VO – tvrdé podmienky - 1. pokus neúspešný
 Koniec r. 2009 - priame rokovacie konanie
 Zmluva s fi. SVOP, s. r. o.
 Koncom apríla 2010 systém uvedený do
ostrej prevádzky
PROCES ZBERU A OVEROVANIA PRÁC
 75% VŠ už práce zbieralo vo svojich EZP
 Bakalárske, diplomové, dizertačné; rigorózne,
habilitačné
 Nutnosť dovybavenia rozhraním,
kompatibilným s rozhraním CRZP
 Proces zberu na VŠ – požadovaný formát,
metadáta, licenčné zmluvy
 Prenos do CRZP - z EZP v dávkach
 Najprv metadáta, potom sa stiahnu samotné
práce
PROCES ZBERU A OVEROVANIA PRÁC
PROCES ZBERU A OVEROVANIA PRÁC
 Kontrola prijatej dávky záverečných prác na
plagiátorstvo voči porovnávaciemu korpusu
 Výsledky porovnania na plagiátorstvo systém
automaticky posiela späť príslušným vysokým
školám
 Samotné texty prác sa začlenia do
porovnávacieho korpusu APS
 Výsledky porovnania sú len podkladom pre
posúdenie a hodnotenie práce príslušnou
komisiou
POPIS TECHNICKÉHO RIEŠENIA
 Technicky sú systémy CRZP a APS
konštruované ako systém spolupracujúcich
serverov
 Samotný antiplagiátorský systém je súborom
viacerých aplikácií a originálnych algoritmov,
ktoré vytvorili vo firme SVOP, s.r.o.
 Sú navrhnuté ako agentový systém a sú
spúšťané dynamicky na základe podnetov
POPIS TECHNICKÉHO RIEŠENIA
ČÍSLA A ŠTATISTIKY
 Do systému CRZP/APS posiela v súčasnosti
záverečné a kvalifikačné práce na porovnanie
na plagiátorstvo 33 vysokých škôl
 Za prvý akademický rok prevádzkovania sa v
systéme CRZP/APS zhromaždilo cca 71 000
záverečných a kvalifikačných prác.
 Zaberajú cca 160 GB úložného priestoru
 Predpoklad podobný aj na ďalšie roky
 Momentálne už cca 140 000 prác
ČÍSLA A ŠTATISTIKY
 z Internetu stiahnutých asi 3.4 milióna
dokumentov v objeme cca 1.4 TB dát
 Porovnanie jednotlivého dokumentu oproti
dnešnému korpusu vrátane spracovania
metadát a vygenerovania PDF protokolu trvá
v priemere 10 sekúnd.
 Maximálna dennú dávka dokumentov mala
4900 súborov, čo trvalo cca 10 hodín
OHLASY, PRÍNOSY A HODNOTENIE
 Počiatočný mediálny záujem rýchlo ustal
 Zo strany vysokých škôl prichádzali väčšinou
pozitívne reakcie
 Samotné technické riešenie sa ukázalo ako
veľmi stabilné a vcelku bezproblémové
 Zatiaľ sa javí, že porovnávacie algoritmy sú
dostatočne rýchle a systém stíha produkovať
výsledky s časovou rezervou, čo je veľmi
pozitívne
OHLASY, PRÍNOSY A HODNOTENIE
 Kvalitu APS algoritmov plánuje dodávateľ
preveriť v medzinárodnej konkurencii na
workshope v Amsterdame na jeseň 2011
 Systém má určite preventívny účinok (skôr
psychologického charakteru
 Krátke obdobie na objektívne hodnotenie
prínosov
 Riešenie je inšpiratívne a príťažlivé aj pre
susedov (Poľsko)
PERSPEKTÍVA ĎALŠIEHO ROZVOJA
 Prenos prevádzky systému do
novovybudovaného DC VaV, ktorého je CVTI SR
prevádzkovateľom a ktoré poskytuje IKT
infraštruktúru najvyššej kvality.
• Urýchli sa proces porovnávania
• Poskytne vyššiu kvalitu zabezpečenia dát
 Sprístupnenie záverečných prác, uložených
v CRZP verejnosti v zmysle novely VŠ zákona
 Zabudovanie primárnych zdrojov (zákony,
smernice, normy, ...)
PERSPEKTÍVA ĎALŠIEHO ROZVOJA
 Skvalitnenie porovnávacieho korpusu
• Staršie práce z VŠ
• Monografie, skriptá, učebnice (?problém AZ)
• Vytypovať ďalšie internetové zdroje
 Skvalitnenie porovnávania zamontovaním
morfologického a synonymického slovníka resp.
slovníka koreňov slov
 Vylepšenie funkcionality, používateľského
komfortu a možností nastavenia systému pre
administrátorov a prevádzkovateľov systému
PERSPEKTÍVA ĎALŠIEHO ROZVOJA
 Optimalizácia výstupných protokolov
 Implementácia opatrení proti trikom, ktorými sa
niektorí autori prác snažia „oklamať“
antiplagiátorský systém
 Dať systém k dispozícii aj na overovanie iných
dokumentov ( seminárky, vedecké, projektové,
...)
 Prepojenie s inými informačnými systémami
ZÁVER
 Systém CRZP/APS má charakteristiku
centrálne poskytovanej služby, hoci je
poskytovaná len vybranej skupine klientov
 O to viac, že je poskytovaná bezplatne
 Systém CRZP/APS sa perspektívne plánuje
rozšíriť aj o poskytnutie služieb iným
inštitúciám ako sú len vysoké školy. Uvažuje
sa napr. o overovaní dokumentov, ktoré sú
výstupmi výskumu a vývoja alebo
dokumentov, ktoré sú súčasťou projektov
finančne podporených z verejných zdrojov.
ĎAKUJEM ZA VAŠU POZORNOSŤ
OTÁZKY?
Juraj Noge
CVTI SR, Bratislava
[email protected]

similar documents