Ferrari, Trinacrian e l'IA

classic Classic list List threaded Threaded
3 messages Options
Reply | Threaded
Open this post in threaded view
|

Ferrari, Trinacrian e l'IA

Jimbo Jambo
Mi sono accorto oggi dell'ennesima dimostrazioni delle difficoltà di it.wiki a gestire l'IA in maniera costruttiva senza pregiudizi negativi.

Il 15 gennaio Giammarco Ferrari (uno degli utenti da tempo nella lista nera degli admin) ha creato una voce da 73k sui Propositi_statunitensi_di_acquisizione_della_Groenlandia, e Trinacriam la cancella in C3 per uso di IA e poi inserisce l'avviso innescando una discussione che sorprendentemente non trascende oltre i limiti. Ferrari con invidiabile calma prova a negare l'accusa e invita a leggere la voce dicendo di aver impiegato una settimana per metterla a punto mentre Trinacriam risponde di aver eseguito dei test automatici che hanno indicato 100% di positivo (se cinque diversi tool concordano nel risultato devo crederci) e quindi la cancellazione é inevitabile. Il problema però è che questi test che sono abbastanza inaffidabili, tanto che persino la linea guida in italiano dice di prenderli con le pinze e guardare piuttosto  "se vi siano allucinazioni, sia nel testo (es. informazioni non vere), sia nel rapporto tra fonti e testo (con fonti che non riportano le informazioni presenti nel testi che dovrebbero fontare)" e giustamente Ferrari invita a spiegare in quali parti la voce fosse carente.

La discussione muore per tre giorni poi il 18 Ferrari si rifà vivo in maniera più decisa con un messaggio decisamente pungente, e stavolta Trinacrian cede e sposta in Sandbox personale. Come si può vedere la voce non era assolutamente da immediata, anzi risulta scritta meglio di tantissime altre voci in NS0. La voce viene portata in NS0 e dopo una (quasi certa) discussione nei canali riservati viene lasciata stare imponendo solo una modifica al titolo comunque condivisibile.

Che dire? Se l'idea di it.wiki è di impedire tout-court l'utilizzo di IA per la creazione delle voci il progetto imploderà ancora piú velocemente di quanto stia facendo. Se un utente si fa aiutare da un LLM o da un traduttore per la creazione di una voce ma la rielabora a mano e non ci sono allucinazioni perché impedirglielo? Capisco che sia più facile far girare un tool automatico che mettersi a leggere 73k di voce ma anche per rispetto ad un vecchio wikipediano con un edit count da far invidia probabilmente si poteva gestire meglio la situazione. Mi chiedo quali siano le fazioni in gioco e se non sia stato un episodio simile ad aver causato anche l'abbandono polemico di Friniate.
Reply | Threaded
Open this post in threaded view
|

Re: Ferrari, Trinacrian e l'IA

TrameOscure
Administrator
Jimbo Jambo wrote
Mi sono accorto oggi dell'ennesima dimostrazioni delle difficoltà di it.wiki a gestire l'IA in maniera costruttiva senza pregiudizi negativi.

Il 15 gennaio Giammarco Ferrari (uno degli utenti da tempo nella lista nera degli admin) ha creato una voce da 73k sui Propositi_statunitensi_di_acquisizione_della_Groenlandia, e Trinacriam la cancella in C3 per uso di IA e poi inserisce l'avviso innescando una discussione che sorprendentemente non trascende oltre i limiti. Ferrari con invidiabile calma prova a negare l'accusa e invita a leggere la voce dicendo di aver impiegato una settimana per metterla a punto mentre Trinacriam risponde di aver eseguito dei test automatici che hanno indicato 100% di positivo (se cinque diversi tool concordano nel risultato devo crederci) e quindi la cancellazione é inevitabile. Il problema però è che questi test che sono abbastanza inaffidabili, tanto che persino la linea guida in italiano dice di prenderli con le pinze e guardare piuttosto  "se vi siano allucinazioni, sia nel testo (es. informazioni non vere), sia nel rapporto tra fonti e testo (con fonti che non riportano le informazioni presenti nel testi che dovrebbero fontare)" e giustamente Ferrari invita a spiegare in quali parti la voce fosse carente.

La discussione muore per tre giorni poi il 18 Ferrari si rifà vivo in maniera più decisa con un messaggio decisamente pungente, e stavolta Trinacrian cede e sposta in Sandbox personale. Come si può vedere la voce non era assolutamente da immediata, anzi risulta scritta meglio di tantissime altre voci in NS0. La voce viene portata in NS0 e dopo una (quasi certa) discussione nei canali riservati viene lasciata stare imponendo solo una modifica al titolo comunque condivisibile.

Che dire? Se l'idea di it.wiki è di impedire tout-court l'utilizzo di IA per la creazione delle voci il progetto imploderà ancora piú velocemente di quanto stia facendo. Se un utente si fa aiutare da un LLM o da un traduttore per la creazione di una voce ma la rielabora a mano e non ci sono allucinazioni perché impedirglielo? Capisco che sia più facile far girare un tool automatico che mettersi a leggere 73k di voce ma anche per rispetto ad un vecchio wikipediano con un edit count da far invidia probabilmente si poteva gestire meglio la situazione. Mi chiedo quali siano le fazioni in gioco e se non sia stato un episodio simile ad aver causato anche l'abbandono polemico di Friniate.
Davvero poco corretto Trinacrian, un comportamento davvero antipatico e insultante nei confronti di GF. L'arrampicata sui vetri per giustificare l’ingiustificabile è palese, e dal resto della talk si vede che GF è preso spesso a male parole da admin molto supponenti e arroganti.
TrameOscure
Reply | Threaded
Open this post in threaded view
|

Re: Ferrari, Trinacrian e l'IA

TrameOscure
Administrator
Questa voce è stata scritta ben due volte con IA, ma secondo i tool non lo era, con certezza al 100% secondo Parma come si vede nella discussione in Wikisource (e i controtest fatti anche da me dopo).
Fra l'altro noto che dell'intera vicenda non v'è traccia nella talk della voce interessata su WP.

Invece la voce di GF che non è fatta con IA viene bollata al 100% come IA.

Quando è IA, segnano 100% non-IA, e quando non è IA segnano 100% è-IA.

Tanto basta per dire che i tool per individuare le IA fanno letteralmente cagare ed andrebbero semplicemente vietati, e chi li usa nel modo di TG punito alla pari di chi fa traduzioni di merda.
TrameOscure