Salve!

quite_logo

Qui trovi degli appunti (sicuramente incompleti e non sempre esatti) presi a lezione dal più al meno recente. Puoi utilizzare le tag (attraverso l'icona nel menu o sotto ogni articolo) per navigare ed avere un elenco (materie, professori, mesi, argomenti) organizzato di contenuti, anche lì le troverai ordinate cronologicamente. Quite (Quick note) non è nulla di perfetto né vuole esserlo. Condividi e migliora Quite con ogni contributo o commento che preferisci, è solo ben accetto!
Se vuoi saperne di più trovi qualcosa nella sezione about!

[LIC] Il gobbo 1

… 1890-1900 elasticità della vita darwinismo sociale, se non riesci ad adattarti è giusto che vengano fatti fuori dalla lotta per la vita. Ma la vita ha sempre cercato di ripianare le inguistizie della natura (carità, compassione, etc.). Come se Bergson vedesse nel massimo della civiltà qualcosa di brutale, come se la legge naturale, spietata, si fosse applicata anche alle società. non basta Non basta che si presti attenzione a qualche cosa, bisogna invece che siamo sempre accenti, sotto continue prestazioni anche di tenore elevato.

[LC] Preparazione del testo

Preparazione del testo Rumore Bisogna compiere una serie di passaggi per avere un testo effettivamente compatibile con le metodologie d’analisi che vogliamo utilizzare. I dati testuali già digitali o digitalizzati contengono un rumore, possono tipo: codici di markup errori di digitalizzazione (ad es. OCR) errori di conversione (caratteri spuri etc.) errori di battitura Fasi principali text cleaning verifica dei caratteri del testo normalizzazione del testo tokenizzazione Text cleaning Ripulire il contenuto testuale dai codici in formato testo che spesso sono presenti da testi scaricati dal Web, ad esempio.

[LIC] C'è qualcuno che ride 2

C’è qualcuno che ride Società maschilista quindi “chi se ne frega” se ride, in realtà sceglie proprio una donna come segno ulteriore di protesta, scegliendo una figura distante dal maschilismo. Un riso che rompe le regole sociali, irriverente quasi arrogante ma perdonabile perché è una giovane donna. Scappata via da quell’angolo, curva, comprimendosi``` La ragazzina una volta visto che era stata notata cerca di soffocarlo e scappa. Non si capisce fino a che punto riesca a sottrarsi alla violenza e il giudizio degli altri e scappa infatti.

[LG] Cos'è una lingua?

Cos’è una lingua? Non sono solo nomenclature, scatoloni di parole, opinione molto diffusa. A livello lessicale le relazioni tra le lingue non sono così semplici. Differenze tra lingue italiano: bosco, legno, legname, legna (tutti concetti diversi) tedesco: bald, holz, geholz, geholz (legname e legna uguali) russo: les, derevo (anche albero), drova (legname e legna) spagnolo: bosque, madera, lena, lena francese: bois, bois, bois, bois it: cavallo ing: horse ted: pferd fr: chenel sp: cabalb ru: kon lit: zirgas arklys (cavallo da guerra o da tiro, non esiste cavallo)

[LC] I Corpus 2

Rappresentatività Chomsky: “any natural corpus will be skewed” Posizione estremista che anche i più ferventi chomskiani non adottano più. I corpus vengono comunque utilizzati adesso, ma le obiezioni che all’epoca erano validissime (corpus di milioni di parole) vale ancora perché la distribuzione dei tratti linguistici per quanto grande sia non può che essere sbilanciato, mancheranno espressioni e costruzioni (o altre in eccesso) rispetto al linguaggio stesso. Nella teoria del campionamento c’è una soglia limite oltre cui ingrandire il campione non cambia troppo andare oltre per avere delle predizioni perché spesso non ne vale la pena.

[LIC] C'è qualcuno che ride

C’è qualcuno che ride Canta l’epistola era tipicamente umoristico, tu ridi è umoristico ma alla fine non c’è più niente da ridere e nemmeno troppo su cui riflettere ma prendere le cose con filosofia senza rifletterci troppo. Pubblicato il 7 novembre 1934 sul Corriere della Sera, in pieno regime fascista. L’umorismo è ormai abbandonato, anche se se ne parla. La scena Siamo ad una festa non si capisce azione in poche ore, siamo nella scena.

[ISS] Biblioteche e libri 2

lez. precedente grandi repertori Libri Roghi, distruzioni di opere d’arte palmira archeologo morto perché non ha voluto rivelare dove ha nascosto parte del tesoro che aveva trovato e di alcune cose aveva fatto trovare dei calchi, targa nella zona degli arsenali a pisa Fahrenheiit 451 romanzo di raymond douglas bradbury (1953) Film di Francois Truffaut (1966) I libri non devono più esistere, esistono solo gli schermi, i libri vanno bruciati.

[ISS] Biblioteche e libri

lez. precedente grandi repertori biblioteche e libri Biblioteche padiglione 0 - immenso - dell’expo, era la rappresentazione di una grande biblioteca, idealmente ogni cassetto rappresentava il sapere quindi la grande storia dell’uomo, e del sapere, iniziano con la storia. tipi biblioteche nazionali univeritarie comunale o civica (generalmente anche raccolta di giornali) scolastiche ecclesiastiche (volute dall’arcivescovo, santa caterina a pisa, domenicana) ospedali (libri di medicina, nel caso degli innocenti anche archivio storico di quanto avvenuto dentro gli ospedali.

[LIC] Tu ridi 2

Tu Ridi protagonista - antagonista (Propp, Greimas) nuora antagonista e la stessa nipotina a cui tiene è antagonista disgrazie figlio sottratto figlio morto la nuora è andata col migliore amico del figlio (o suo?) e lasciato cinque orfanelle a carico nipote a cui volava tanto bene malata/malnutrita lei con tutte le sciagure che stanno sulle spalle di anselmo pensa che pensi alle «belle donnine». “quella sua sorte amica in mano alla moglie, perché si spassasse a inciprignirgli le piaghe, tutte quelle piaghe, di cui graziosamente aveva voluto cospargergli l’esistenza.

[LC] I corpus

corpora e linguistica computazionale vedi slide fare un corpus è scienza, non ci sono modi matematici che ci dicono come selezionare e cosa. Ma è un’opera d’arte (artigianato) legata a vincoli pragmatici dagli anni ‘50 ci sono due vie una di creazione di regole grammaticali algoritmiche e parallelamente la digitalizzazione dei corpora. Solo negli anni ‘90 si incontrano con la rivoluzione empirista del Natural Language Processing empirico, statistico, machine learning e deep learning (è sempre un metodo di apprendimento come gli altri solo usa reti neurali) (Charniak, Church, et al.