1) introduzione alla IU: Flashcards
cos’è l’informatica:
L’informatica è una disciplina che si occupa del trattamento automatico dell’informazione.
cosa sono le scienze dell’informazione:
Con scienze dell’informazione ci si riferisce in generale a tutte quelle discipline che si occupano dei processi e dei sistemi di analisi, reperimento, raccolta, conservazione, trasformazione e trasmissione dei dati, che diventano informazione.
Per questo è lecito asserire che la nozione di sistema di rappresentazione ed elaborazione delle informazioni, che qualifica l’informatica, è una definizione adeguata anche a descrivere la ricerca di settore umanistico.
come si passa da un dato a un’informazione:
il dato è l’elemento di input che restituisce un’informazione a livello output. la conoscenza ci permette di capire cos’è il dato, ma l’informazione è tale solo se sappiamo contestualizzarla
il ruolo dell’informatica:
Ciò che la computer science costringe a fare è trasformare i dati, che identificano tutti gli oggetti portatori di informazione, in sistemi che definiremo formali, cioè costruiti in base a precisi schemi e quindi secondo specifiche regole.
Quello che è formalizzato diventa computabile, quindi risolvibile sulla base di processi automatici.
Ambiguità e indeterminatezza devono essere sostituiti da schemi e regole, strutture e modelli.
Il fondamento teorico che sarà alla base del nostro ragionamento consisterà dunque nell’analisi dei sistemi di progettazione e creazione di oggetti computabili.
‘algoritmo’ come ‘ricetta’:
un algoritmo è assimilabile a una ricetta (ex. per indicare a una macchina cosa fare e quando, è simile al dover seguire una ricetta. ex. ‘quando l’acqua raggiunge la temperatura di 100 C°, aggiungere 10 gr di sale) > necessario è nell’informatica togliere tutta l’ambiguità tipica delle materie umanistiche, e trasformarle in regole formali (ex. non si può dire ‘un pizzico di sale’)
storia dell’informatica umanistica: analisi del testo:
A partire dagli anni ‘40 del ‘900 = analisi del testo.
È lo spazio della linguistica computazionale che riguarda i sistemi di elaborazione automatica di indici, gestione di frequenze, implementazione di concordanze, lemmatizzazioni, realizzazione di dizionari, fino alle analisi stilometriche;
Negli anni ‘40 infatti ottenne l’IBM di un finanziamento per acquisire un calcolatore che lavorasse sull’opera omnia di san tommaso d’aquino, tramite un sistema di schede perforate > l’obiettivo era creare indici, tirano fuori tutte le parole dal testo, stabilire frequenze (quante volte la parola occorre nel testo), le concordanze (ovvero un particolare indice dotato di contesto, ovvero che presenta concordanze a sinistra e a destra).
Questa, che in linguistica computazionale è detta ‘analisi del testo’, è alla base dell’informatica umanistica, poiché è la prima volta che un computer viene usato per lavorare non solo su dati numerici, ma anche su dati inerenti alla parola.
storia dell’informatica umanistica: sistemi di organizzazione di dati:
A partire dagli anni ‘60 del ‘900 = sistemi di organizzazione di dati, in modo che l’informazione sia veicolata dal contesto (DBMS - Data Base Management Systems) per informazioni strutturalmente omogenee e classificabili in modelli o schemi di riferimento precostituiti; I primi database erano gerarchici e a grafo/albero (il grafo spezza la gerarchia e introduce relazioni di tipo trasversale, cioè relazioni che vanno da un ramo all’altro, da cui magari non discende direttamente).
Negli anni ‘70 nasce il database relazionale, principalmente per sopperire all’uso nelle biblioteche; si basava su una struttura dati in tabelle. La tabella consente di astrarre le caratteristiche comuni da un gruppo di oggetti, trasformarle nei descrittori di quella collezione e di dare quindi valori omogenei agli oggetti contenuti nella tabella.
La tabella funziona per righe e colonne; tipicamente, nella prima riga vi sono generalmente gli attributi descrittivi della tabella (ex. se dovessimo fare una tabella contenente dei libri, la prima riga conterrebbe il titolo, il genere, l’autore…)
Nella prima colonna, vanno i libri della tabella (distinti da un ID, così che possano essere distinti anche se con lo stesso titolo, stesso anno di pubblicazione etc.)
così si può formalizzare la conoscenza che ho dei dati, il cui contesto me lo da la posizione della stringa nella griglia.
storia dell’informatica umanistica: codifica o annotazione del testo tramite linguaggi di markup:
A partire dagli anni ‘80 del ‘900 = codifica o annotazione del testo tramite linguaggi di markup (tags) per l’intervento sui diversi livelli dell’analisi del testo letterario (strutturale, morfologica, semantica, narratologica, codicologica, paleografica, ecc.);
Se i database vengono usati per dati che entrano facilmente in una griglia, il markup viene usato per sistemi non strutturati, come capita con sequenze di stringhe di caratteri. Esse vengono aggiunte a sequenze di caratteri già esistenti per arricchire quel dato e trasformarli in un’informazione.
Anche il markup può essere usato per modelli strutturati, ma in genere in quel caso si usa il data base (un metodo non esclude l’altro).
storia dell’informatica umanistica: il www
A partire dagli anni ‘90 del ‘900, ma teoria è stata elaborata dagli anni ‘40. Nasce il World Wide Web (piattaforma capace di far circolare i dati, chiamati-quando collegati fra di loro- ipertesti ; il concetto di ipertesto era già esistente, per cui per il WWW nasce da elementi già esistenti).
Elaborazione di costrutti ipertestuali, vale a dire creazione di reti di correlazioni a livello intertestuale e metatestuale e definizione di mappe concettuali (scelta delle informazioni correlate pertinenti e gestione dei link fra le sezioni di contenuto).
3 cose per far funzionare il modello:
- 1 linguaggio; il linguaggio usato è l’html
- 1 protocollo di interscambio. ex. l’HTTP; fa parte dell’URL, cioè dello strumento che consente di identificare l’ipertesto in rete, e di renderlo fruibile nel web
- 1 sistema di indirizzamento univoco; il primo fu l’URL
definizione di Digital Humanities:
Le Digital Humanities sono un’area di ricerca, insegnamento e creazione che si occupa dell’intersezione tra informatica e discipline umanistiche.
Le Digital Humanities (spesso abbreviate in DH) attualmente incorporano sia materiali digitalizzati che nati digitali e combinano le metodologie delle discipline umanistiche tradizionali (come storia, filosofia, linguistica, letteratura, arte, archeologia, musica e studi culturali) e scienze sociali con strumenti forniti dall’informatica (come visualizzazione dei dati, recupero delle informazioni, data mining, statistica, text mining) e pubblicazione digitale.
lo shifting terminologico:
intorno agli anni ‘40, si inizia a parlare di humanities computing ( = utilizzo del calcolatore per gli studi umanistici):
Con lo sviluppo del www, vi è lo shifting terminologico, quindi col passaggio da una ricerca e un’attività di semplice computazione, a una incentrata sulla restituzione e la rappresentazione del dato all’utente.
In particolare si parla di DH a partire dal 2004 con l’opera ‘A companion to digital humanities’.
Si aggiungono così i principi (ex. come funziona il computer, le strutture dati…)
la storia delle DH:
- Padre Roberto Busa inizia a produrre l’index verborum (o meglio le concordanze) degli opera omnia di Tommaso
d’Aquino. Siamo nel 1949. Primo lavoro di analisi del testo. - Fondazione della rivista «Computer and the Humanities». Siamo nel 1966 (fino al 2004).
- Nascita di due importanti associazioni: la ALLC (Association for Literary and Linguistic Computing), fondata nel 1973, e la ACH (Association for Computer in the Humanities) fondata nel 1978;
- I membri di ACH e ALLC sono editor di un importante rivista di settore: «Literary and Linguistic Computing»: (fondata nel 1986). Ora «Digital Scholarship in the Humanities»;
- Nasce «Humanist», international online seminar, 1987;
- Dagli anni ‘90. Web revolution…;
- ACH e ALLC si sono federate nella “Alliance of Digital
Humanities Organizations” (ADHO - (associazione europea di DH). Siamo nel 2005 ; - Fra le varie attività di ADHO si registra la nascita, nel 2007, della rivista elettronica «Digital Humanities Quarterly» (DHQ)
- ALLC è dal 2012 EADH (“European Association for Digital Humanities”)
cosa significa ‘progettare’ nell DH?
significa stabilire il ciclo di vita degli oggetti digitali:
> gli step per arrivare alla realizzazione della risorsa digitale
gli step della progettazione:
- selezione > dobbiamo porci il problema di che tipo di file si tratta
- creazione degli elementi digitali (ex. selezionare oggetti cartacei e crearne di digitali, ma non solo)
- descrizione
- fase di gestione: una volta creati i file e descritti; tipicamente in questa fase si elabora uno spazio per la conservazione degli oggetti creati
- fase della scoperta: gli oggetti devono essere pubblicati al fine di essere utilizzati; la messa a disposizione del progetto;
- uso e riuso, i dati devono essere rilasciati in modo che possano essere utilizzati ancora in contesti diversi
L’obiettivo principale di questo corso è studiare questo ciclo vitale di oggetti digitali per arrivare ad elaborare una proposta di progetto
gli elementi essenziali di un progetto:
- deposito di file/digital assets (i progetti digitali possono essere archiviati in un’architettura informativa come un database o un file system (ex. un hard disk) dove è possibile accedervi (servizi) e richiamarli da un browser (uso/visualizzazione).
- un tipo di architettura informativa
- una serie di servizi che mi permettono di navigare i file
- un display per l’uso dell’utente
Un qualunque progetto digitale è un insieme di file posti su disco rigido e con dei servizi che sono in grado di leggerli.
ex. per leggere un file .jpg (=estensione, che ci dice che tipo di file è), il mio computer avrà un’app capace di leggere quella estensione (ex. jpg è una foto, quindi l’app della galleria può leggere il file)
caratteristiche di un progetto Web nelle DH:
Ogni progetto Web nel settore DH deve avere certe caratteristiche:
1. Una collezione di file (pagine HTML), detto anche digital asset > si limita solo a mostrarmi le componenti di struttura logica, come i titoli, i paragrafi, gli elenchi, le tabelle, i collegamenti ,le immagini…
2. Un insieme di oggetti digitali diversi (immagini, ma volendo anche file audio e/o video)
3. Un’interfaccia Web per l’accesso (che gestiamo con i fogli di stile CSS)
4. Una home page evocativa e riassuntiva di quanto il sito offre strumenti di accesso e interazione per/con l’utente finale (un po’ di Javascript) > modifica come l’utente vede restituiti i dati html
5. Più strumenti di navigazione per consentire all’utente di accedere ai contenuti
6. Possibilmente download di file in formati vari
7. Descrizione di ogni oggetto della collezione (metadati) (oggetto = sia il file che fa parte del mio patrimonio culturale, del progetto, sia il file html che ho prodotto)
8. Collegamenti ipertestuali specifici per ogni contenuto o pagina
9. Accorgimenti tipografici ad hoc
10. Uso di colori adeguato al topic
cosa sono gli strumenti integrativi di browsing:
ex. strumento per filtrare i contenuti > tutto ciò che è un link che mi manda da qualche altra parte
strumenti di interfaccia per l’interazione con l’utente:
ex. ogni volta che spostando il mouse cambia l’aspetto di ciò sui cui sto.
differenza fra strumento browsing di base e strumenti integrativi:
- lo strumento browsing di base = determinato dai canali principali di navigazione (accesso canonico al catalogo attraverso una tabella)
- strumenti integrativi = integrano l’accesso attraverso una sequenza di dati con strumenti alternativi per accedere a quegli stessi contenuti (ex. la linea del tempo, mappa, temi, il fatto di poter andare avanti e indietro) > tutto ciò che in qualche modo contribuisce alla navigazione pur non essendo strumento di navigazione primaria; esistono vie di mezzo, possono essere strumenti di base per ciò che riguarda la loro posizione ma integrativi per ciò a cui rimandano, e viceversa