Vai al contenuto
  • Chi sta leggendo   0 utenti

    Nessun utente registrato visualizza questa pagina.

Bango Skank

Come analizzare alcune particolarità dei propri testi e della propria scrittura

Post raccomandati

Ho scoperto un programma online davvero simpatico.

Si chiama Voyant, basta inserire la parola su un motore di ricerca e cliccare poi su Voyant Tools.

Nella pagina che si apre si va a caricare il file del proprio romanzo in formato docx e poi appare la schermata che ti "dice cose" sul tuo romanzo.

Ho riflettuto se fosse il caso di inserire questa discussione nell'area dedicata ai Software; alla fine ho pensato che il posto migliore è questo.
Spiego il motivo.

Più che un software "per scrivere" questo è un software che serve per analizzare il testo.

Può essere interessante confrontarsi su determinati risultati.

Tra le funzioni che ho trovato più utili (compaiono subito in prima schermata in basso a sinistra) quelle che ti dicono il numero di "termini unici" e l'"average word per sentence". Ho inserito il parziale del romanzo che sto editando, fin dove siamo arrivati: 70mila parole e 10mila "uniche" (densità di 0.146, molto molto alta) e un average di 9.5, molto molto basso. In effetti, rispecchia il mio stile: secco ma con un vocabolario ricco.

Mi dice poi i termini più usati nel romanzo: 246 poi e 174 cosa ai primi due posti. Vero: utilizzo moltissimo "poi" per legare le frasi. Forse anche troppi... ci devo riflettere.

Ho inserito un altro romanzo, appena terminato. 60mila parole, 9mila termini unici, 10.6 di average. In linea: questo può definire, in un certo senso, il mio stile.

Vado a vedere le parole più usate, voglio controllare i miei buoni "poi" e "cosa" come si collocano.

secondo e terzo, con 207 poi e 175 cosa (primo è un nome che torna spesso).

Ora, i due romanzi sono di generi completamente diversi. Sinceramente, non mi sarei mai aspettato di avere una simile "linearità"; pensavo di aver usato nel secondo molti meno termini, invece in proporzione ne ho usati di più, con una densità di 0.158;  pensavo che lo stile dei romanzi fosse assolutamente diverso, e in parte lo è... ma se le parole che uso, le formule che uso sono "sempre quelle", vuol dire che la mia scrittura è riconoscibile dalla scienza molto più di quanto lo sia dalla mia autoanalisi.

Ci sono molte altre funzioni che devo ancora scoprire, ma già queste mi hanno fatto riflettere.

Ve lo consiglio... ci vuole un minuto a caricare il file e a vedere i risultati (anche meno).

Se vi va, scrivete qui quello che "scoprite". 

 

 

 

  • Mi piace 12
  • Grazie 6
  • Non mi piace 2

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Ho provato a inserire una raccolta di racconti di bizarro fiction.

24mila parole, 5900 uniche (quindi una densità, di 0.239 che è molto alta ma ci sta, perché più il testo è breve e più si alza, se poi sono racconti che parlano di cose diverse meglio ancora).

prime due parole indovinate un po'? Poi e cosa!

Ma quello che è davvero interessante è l'average della lunghezza media delle frasi: 14.

Molto molto più alto del mio solito.

Ho inserito poi una raccolta di storie nere. Tutto in linea, tranne l'average, che torna sul 10.

Quindi: quando scrivo bizarro fiction, ovvero ironico, quasi comico, tendo ad utilizzare frasi più lunghe del 40% rispetto a tutto ciò che scrivo. A che mi serve saperlo? Ancora non lo so, ma che figata!:D

  • Divertente 2

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
15 minuti fa, Marcello ha detto:

Bello, appena ho un attimo provo.

Assolutamente Marcè, sono curiosissimo di sapere il tuo average medio! Hai uno stile molto più fluido e meno "secco" ed essenziale del mio, quindi credo che la differenza sarà grossa. Minimo minimo un 15.:D

Ps: evitate battute sul fatto che qui si fa a chi ce l'ha più lungo.

L'average, dico.

  • Divertente 4

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Mi hai risolto la giornata. Mi chiedevo proprio se esistesse qualcosa del genere per liberarmi di tutte le parole ripetute troppo spesso. 

  • Mi piace 1

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

@Bango Skank Bellissimo strumento, grazie per la segnalazione. Mi pare di capire che congiunzioni e articoli vengano filtrati automaticamente, altrimenti dovrebbero dominare la classifica delle parole più usate.

  • Mi piace 3

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
29 minuti fa, Bango Skank ha detto:

Ps: evitate battute sul fatto che qui si fa a chi ce l'ha più lungo.

L'average, dico.

Ecco @Bango Skank, adesso la battuta me l'hai bruciata!

 

Scherzi a parte, grazie mille. Sono caduta in un trip infinito... Quando avrò imparato ad usare questo programma dovrò capire come interpretare i risultati! :occhiali:

 

  • Divertente 2

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Forte! Secondo voi le agenzie e le CE usano qualcosa di simile o magari anche di più sofisticato? Tanto per rendersi conto da subito che tipo di testo hanno in mano.

@Bango Skank tu che sei rappresenatto da un'agenzia forse riesci a saperlo. Sarei curioso.

Ora lo provo, grazie della dritta ;)

  • Mi piace 1

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
7 minuti fa, mercy ha detto:

Scherzi a parte, grazie mille. Sono caduta in un trip infinito... Quando avrò imparato ad usare questo programma dovrò capire come interpretare i risultati! 

e una volta interpretati, capire come modificare la tua scrittura e poi una volta modificata vedere se piace  lo stesso, per poi ricaricare di nuovo e vedere i nuovi risultati e interpretarli e poi vedere se... aiuto! :D

  • Mi piace 1
  • Divertente 2

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
15 minuti fa, nemesis74 ha detto:

Forte! Secondo voi le agenzie e le CE usano qualcosa di simile o magari anche di più sofisticato? Tanto per rendersi conto da subito che tipo di testo hanno in mano.

@Bango Skank tu che sei rappresenatto da un'agenzia forse riesci a saperlo. Sarei curioso.

Ora lo provo, grazie della dritta ;)

no, lo escludo nel modo più assoluto.

questo me lo ha fatto vedere la mia compagna che si sta laureando in editoria... analisi computazionale che, cito Giorgia che mi è davanti, fanno solamente alcuni teorici e ricercatori, sopratutto esteri!

Mi ha detto che c'è anche un programma più "forte" per comparare testi diversi di autori diversi o dello stesso autore (ma anche in questo si possono inserire più testi, mi dice).

insomma: roba da "nerd" della narrativa, roba da teorici! XD

  • Mi piace 3

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Strumento molto interessante, grazie @Bango Skank :D Sostanzialmente mi ha detto quello che già sapevo: faccio frasi molto lunghe. La cosa mi ha fatto un po' arrabbiare, perché pensavo di aver lavorato sulla sinteticità, ma evidentemente non ha funzionato. Quindi frasi di lunghezza media 15/17 parole e una densità di vocabolario che mi ha sorpresa: nei tre testi che ho analizzato si aggirava sempre attorno allo 0.5. Nessuna parola ricorrente in tutti i testi, tipo i tuoi "cosa" o "poi", il che è strano perché le ripetizioni sono un problema che mi viene segnalato spesso.

 

Mi pare molto interessante anche la funzione "link", che mostra le associazioni di parole più frequenti. Non so bene che utilità possa avere, ma sicuramente è interessante dal punto di vista psicologico.

 

Parlando degli usi di uno strumento del genere, sono d'accordo nel dire che è più uno strumento da studiosi che da CE. Un uso che potrebbe esserne fatto è quello di smascherare pseudonimi di autori famosi, un po' come quando si è scoperto che Robert Galbraith era in realtà J.K. Rowling perché aveva uno stile molto simile (o forse per una più semplcie fuga di informazioni :D ).

Io, ai corsi di traduzione, usavo strumenti simili per studiare le combinazioni più frequenti di certe parole (ad esempio preposizioni e verbi) nei testi inglesi, così da capire come scrivere in inglese ad un livello quasi madrelingua.

 

 

  • Mi piace 1

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
4 minuti fa, Lizz ha detto:

Quindi frasi di lunghezza media 15/17 parole e una densità di vocabolario che mi ha sorpresa: nei tre testi che ho analizzato si aggirava sempre attorno allo 0.5

15-17 non è poi così lungo... credo sia la norma... è 10 che è davvero "basso".

0.5 di densità è una media pazzesca... immagino sia stata estrapolata da 3 racconti brevi (ed è in ogni caso altissima, immagino).

se è così, prova a inserire tutti e tre i racconti in un unico file e a vedere se cambia, sarebbe interessante (io finora ho inserito solo il file con tutti i racocnti, non ho fatto la controprova racconto per racconto). In ogni caso, se non hai termini ricorrenti e un average alto, vuol dire che hai uno stile fluido agli antipodi del mio. Interessantissimo, grazie :)

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
4 ore fa, Bango Skank ha detto:

Ps: evitate battute sul fatto che qui si fa a chi ce l'ha più lungo.

:rofl:

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
3 ore fa, Bango Skank ha detto:

15-17 non è poi così lungo... credo sia la norma... è 10 che è davvero "basso".

0.5 di densità è una media pazzesca... immagino sia stata estrapolata da 3 racconti brevi (ed è in ogni caso altissima, immagino).

se è così, prova a inserire tutti e tre i racconti in un unico file e a vedere se cambia, sarebbe interessante (io finora ho inserito solo il file con tutti i racocnti, non ho fatto la controprova racconto per racconto). In ogni caso, se non hai termini ricorrenti e un average alto, vuol dire che hai uno stile fluido agli antipodi del mio. Interessantissimo, grazie :)

Puntavo a uno stile con tre parole per frase al massimo :P Dai, mi consolo: allora la Proustite non mi è ancora diventata acuta!

Sì, i tre racconti sono il risultato di MI passati, quindi tutti sotto gli 8000. Ho provato a farli "valutare" tutti assieme, come un testo unico, e poi aggiungendo un altro paio di racconti, ed effettivamente la percentuale si è abbassata a 0.3. Il programma ha anche fatto emergere alcuni termini ricorrenti (quando, poi, così) che forse prima non erano stati notati per via della brevità dei racconti.

 

Insomma, così è appurato che per avere risultati utili è meglio avere un corpus di almeno 30 000 caratteri... e anche che, a fare queste analisi, poi si rischia di farsi venire un sacco di fisime: come farò adesso, a evitare di scrivere quando, poi, e così? :noo: 

  • Mi piace 1

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
4 ore fa, Bango Skank ha detto:

Minimo minimo un 15

14,4 invece.

Ho caricato "La pista portoghese" per ora, poi lo farò anche con gli altri.

 145,157 totale parole e con 17,790 forme di parola uniche.

Average Words Per Sentence: 14.4

parole più frequenti: Gretije (637) lo immaginavo! ; prima (395); due (365); stato (345); ancora (337)

  • Mi piace 2

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Ho provato con tre racconti medio-lunghi:

 

Racconto 1:  11.984 parole;  72.490 caratteri; 3.700 parole uniche; densità 0,32; average 22,3.

 

Parole più frequenti: Winston (il protagonista del racconto (56); capo (39); maggiore (34); due (33); pietra (33).

 

Racconto 2:  6.449 parole; 38.899 caratteri; 2.377 parole uniche; densità 0,369; average 22,3

 

Parole più frequenti: due (21); cosa (17); me (17); ora (17); piuma (17).

 

Racconto 3: 4.850 parole; 30.587 caratteri; 2.109 parole uniche; densità 0,435; average 33,0

 

Parole più frequenti: capitano (19); dopo (18); qualche (18); prima (15); nave(14).

 

 

Accorpandoli tutti e tre:  22.846 parole; 142.065 caratteri; 6.374 parole uniche; densità 0,279; average 24,0

 

Parole più frequenti: due (60); dopo (59); poi (57); winston (56); capo(49).

 

 

Due osservazioni: com'era prevedibile, la densità tende a scendere con la lunghezza dei racconti, mentre la lunghezza delle frasi sembra relativamente random.

 

Due curiosità: nelle prime cinque parole ho anch'io come @Marcello il nome del protagonista e la parola "due" (ma tutti 'sti due da dove vengono? Mah).

 

Un grande rimpianto che mi amareggia: per un'inezia non pareggio dopo (59) e poi (57), questa è jella, ragazzi!

 

 

  • Mi piace 1

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
56 minuti fa, massimopud ha detto:

(ma tutti 'sti due da dove vengono?

:grat:

57 minuti fa, massimopud ha detto:

per un'inezia non pareggio dopo (59) e poi (57), questa è jella, ragazzi

:D

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Ho provato anche io con un racconto di 5210 parole:

1521 parole uniche

Densità del vocabolario: 0.292

Average Words Per Sentence: 12.5

Grandi protagoniste prima un nome... e non del protagonista, con 32 apparizioni, poi le parole me 31 volte e così 22

 

Pensavo che le mie frasi fossero più lunghe in realtà, invece non capisco bene cosa significa densità di vocabolario? 

 

Ho provato anche con un romanzo corto, 24846 parole, 4520 parole uniche

Densità del vocabolario: 0.185

Average Words Per Sentence: 17.1

Le parole più usate sono due nomi: il primo 340 volte ed è il protagonista, l'altro 90..., maledizione e mentre 75 volte

 

Qua le frasi sono più lunghe, ma è comprensibile credo perché è una storia per ragazzi, forse troppo lunghe però. Capisco comunque di avere un problema con i nomi :grat:

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Ho buttato dentro tre raccontini

Questo corpus contiene 1 documento con 4,602 totale parole e con 1,660 forme di parola uniche.

Densità del vocabolario: 0.361

Average Words Per Sentence: 17.0

 

Parole più usate (a parte nomi di personaggi): poi, così, sempre, quando.

 

Racconto singolo:

Questo corpus contiene 1 documento con 2,177 totale parole e con 874 forme di parola uniche. Creato 2 secondi fa.

Densità del vocabolario: 0.401

Average Words Per Sentence: 15.6

  • Mi piace 1

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Davvero ganzo.

Come tutti gli strumenti statistici, ha un funzionamento che cambia a seconda dei numero di "campioni" (ossia delle parole) che gli si danno in pasto. Non credo che la lunghezza media dei periodi subisca grandi variazioni, mentre al contrario la densità del vocabolario tende a zero all'aumento della lunghezza del testo – il caso estremo sarebbe un testo di lunghezza infinita, che porta a 0 la divisione a prescindere dal numero di parole uniche.

Quindi "vocabulary density" è da prendere un po' con le pinze, come statistica. Si possono solo fare confronti fra testi di lunghezza simile.

 

Gli ho dato in pasto il parziale (56mila parole circa) del grumo di caratteri che sto scrivendo. In testa alle parole più frequenti ci sono i nomi dei personaggi. È interessante, perché riflette una scelta che ho fatto consapevolmente: nominare il personaggio senza ricorrere a sotterfugi (soprannomi, ruoli, "l'uomo", "la donna", "il cugino dello zio che poi è morto") che a volte mi hanno infastidito in dei romanzi che ho letto.

Poi che sia una scelta efficace o meno, ancora non ne ho idea. :asd: 

Valuterò a fine corsa.

  • Mi piace 2

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Forse si può usare per la saggistica, ma per la narrativa mi sembra uno strumento un po' sterile, anzi, proprio eviterei di applicare la statistica alla narrativa, e non penso proprio che le case editrici lo usino. Forse se non sai come passare il tempo e ti va di giocare... ma per il resto non ne vedo l'utilità. Unpopular opinion?

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Ho provato anch'io con un intero romanzo e il risultato è:

 

Parole complessive: 60,670

Parole uniche: 11,058

Densità del vocabolario: 0.182

Average Words Per Sentence: 20.3

Parole più frequenti nel corpus (a parte i nomi di due personaggi ai primi due posti); poi (164); così (159); po' (145)

 

È un bene, è un male? Non so. :D

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
8 minuti fa, SeeEmilyPlay ha detto:

Forse se non sai come passare il tempo e ti va di giocare... ma per il resto non ne vedo l'utilità.

In un mio brutto periodo, uno dei momenti chiave è stato l'incontro con un senzatetto che mi gridò «ripigliati, che mi fai schifo pure a me».

Gli spunti di riflessione utili possono venire anche da dove non ti aspetti, e secondo me è bene non porre freni alla retrospettiva. :D

L'importante non sono tanto gli strumenti in sé e il loro risultato secco, ma l'elaborazione personale e la consapevolezza che se ne trae.

Modificato da AdStr
  • Mi piace 6

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Anch'io ho provato a caricare alcuni racconti e, come era prevedibile, caricando testi lunghi si abbassa il numero di parole uniche, densità e ripetute. Caricando singolarmente alcuni dei miei iceberg come risultato ho ottenuto, 700 parole uniche su testi di poco superiori a mille e  una misura media di 14,5. Quello che mi ha stupito è stato il grafico armonioso ed equilibrato con picchi regolari. Una meraviglia! Avrei caricato la foto ma non sono riuscita a capire come fare. Davvero stupefacente, ma ciò è assolutamente normale. Caricando infatti il testo lungo al quale sto cercando di lavorare tutto cambia. La media diventa 18,8, le parole uniche e la densità perdono tantissimo (e se estrapolo un pezzo ugualmente lungo cambia ancora) Questo perché tiene conto di preposizioni e avverbi senza le quali un testo lungo non può essere scritto. Resta sicuramente un aiuto per scovare parole ripetute troppe volte. Se avete un HP, però, cercando con la lente vi da già la quantità presente nel testo (io lo uso), ma ovviamente devi chiedere tu di quantificare la parola (d'altronde è lo stesso strumento per ripescare una parola e recuperare il punto esatto im cui si trova nel testo, senza dovere scorrere tutto il testo) mentre questo programma dà una panoramica più ampia e completa. 

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
14 minuti fa, SeeEmilyPlay ha detto:

per la narrativa mi sembra uno strumento un po' sterile

Non ne sono convinto, proprio io, che – lo sapete a memoria,ormai – sono uno degli esseri meno "tecnologici" del forum.

Forse non sappiamo ancora come usarlo, probabilmente a taluni sarà più utile che ad altri, ma credo che possa avere una sua utilità proprio in narrativa, piuttosto che in saggistica dove è facile che i termini relativi alla materia del saggio siano preponderanti.

Temevo per esempio che nel mio romanzo ci fosse un eccesso di termini "polizieschi", quali: indagine, inchiesta, polizia, assassinio, omicidio, vittima...  e invece nessuno di questi occupa i primi posti.

Allo stesso modo l'uso di parole uniche e la densità del vocabolario ci aiuta a comprendere meglio come usiamo la lingua.  Nei romanzi che edito mi capita a volte di rimproverare agli autori una certa povertà del lessico (sembra che "vedere" e guardare" siano le uniche azioni che si possono realizzare con gli occhi e "dire" l'unica con la bocca), ecco sono convinto che se provassi a caricare uno di quei romanzi (ma, per ovvie ragioni, non lo farò) noterei delle differenze sostanziali.  

E se non le notassi dovrei iniziare a preoccuparmi, perché significherebbe che commetto gli stessi identici errori che correggo agli altri.

  • Mi piace 1

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Ho voluto provare con un racconto lungo, ecco i risultati:

21,738 totale parole

5,930 forme di parola uniche.

Densità del vocabolario: 0.273

Average Words Per Sentence: 18.5

Il nome del protagonista compare 177 volte (!)

Trovo interessante il grafico in alto a destra che mostra l'andamento delle varie parole. 

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Ho provato anche io, ma visto che non so davvero che cosa trarre dai risultati (eccetto che le ripetizioni delle parole, quelle utili) provo a metterli qui. @Bango Skank magari puoi darmi una mano a interpretarli? :)

Ho buttato su uno dei miei romanzi: 140.409 parole in totale con 15.361 forme di parola uniche. Densità del vocabolario: 0.109 e Average Words Per Sentence: 15.5

Come parole più ripetute ho ai primi due posti i nomi propri della protagonista e co-protagonista, con uno stacco abissale (902 la prima, 690 il secondo), ma questo reputo che sia dovuto al fatto che il co-protagonista è introdotto dopo 1/3 dall'inizio del romanzo. Quello che può essere un problema è la ripetizione della parola "occhi", che li utilizzo molto spesso come veicolo di emozioni, parole mute ecc... qui ci si lavora :lol:

Però degli altri dati non saprei davvero che dire. Potreste darmi una mano? Grazie :sss:

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti
3 minuti fa, Marcello ha detto:

Temevo per esempio che nel mio romanzo ci fosse un eccesso di termini "polizieschi", quali: indagine, inchiesta, polizia, assassinio, omicidio, vittima...  e invece nessuno di questi occupa i primi posti.

Non parlo del tuo caso specifico, ma in generale il pericolo non viene scongiurato da uno strumento del genere. È dovuto al fatto che tiene in considerazioni anche molte di quelle che nel campo NLP (Natural Language Processing) si chiamano "stopwords" – tipo i vari però, così, cioè, come eccetera.

Non ho visto prima se è possibile farlo, ma sarebbe interessante poter accedere alla classifica completa, e non solo alla cima. Così facendo, potresti sgamare alcune parole che secondo il tuo giudizio sono comunque troppo ricorrenti, e magari che distano solo di poco da quelle di testa. Assassinio & co. potrebbero annidarsi lì.

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Crea un account o accedi per lasciare un commento

Devi essere un utente per inserire un commento.

Crea un account

Iscriviti per un nuovo account nella nostra community. È facile!

Registra un nuovo account

Accedi

Sei già registrato? Accedi qui.

Accedi Ora

×