Ricerca efficiente per parole chiave in un grafo rdf
- Tipologia:
Tesi di Laurea di primo livello
- Anno accademico:
2009/2010
- Relatore:
- Eugenio Di sciascio
- Università:
Politecnico di Bari
- Facoltà:
Ingegneria
- Corso:
Ingegneria Informatica
- Cattedra:
sistemi informativi
- Lingua:
- Italiano
- Formato:
- Protezione:
- DRM Adobe
- Dimensione:
- 3.36 Mb
Descrizione Ricerca efficiente per parole chiave in un grafo rdf
Il web semantico non è qualcosa di distinto dal web attuale, ma una sua implementazione che focalizza l’attenzione sulle metodologie di organizzazione delle informazioni per migliorare la fruibilità del web. Fornisce regole sintattiche e semantiche per la redazione dei documenti allo scopo di consentire non solo alle persone, ma anche alle macchine di comprendere i contenuti sul web. Al fine di consentire ai computer di interpretare in modo inequivocabile dati grezzi, è necessario descriverne il significato per mezzo di metadati. In questo contesto, rdf è stato concepito per fornire un modo semplice e conciso per rappresentare qualsiasi tipo di dati e metadati secondo un modello flessibile. L’aumento della quantità di dati rdf ha naturalmente determinato l’esigenza di progettare soluzioni efficiente per la loro memorizzazione e recupero. Ci sono attualmente molte proposte per l'archiviazione di dati semantici. In questo tesi verranno inizialmente presentati i linguaggi per l’organizzazione e la costruzione del web semantico. In particolare, partendo da xml, viene introdotto il modello dei dati rdf; per poi passare a rdf schema, al concetto di “ontologia” e ad owl, un linguaggio per la definizione di ontologie nel web semantico. Per ultimo si prende in esame il linguaggio di query sparql (compresa la versione 1. 1) con il quale possono essere individuate ed ottenute particolari informazioni a partire da un grafo rdf. Vengono poi descritti gli sviluppi effettuati recentemente nell’ambito del semantic web per quanto riguarda la memorizzazione e il recupero efficiente delle informazioni rdf. Dapprima verranno analizzate, nel dettaglio, soluzioni basate sulle tecnologie relazionali e gli schemi utilizzati per far fronte all’incompatibilità dei modelli (grafordf vs tabellerelazionali), per poi prendere in esame alcune alternative ad esse, come i database orientati agli oggetti (object-oriented database) e i cosiddetti in-memory database systems (imds). In particolare verrà descritto il movimento nosql, nato dall’esigenza di scalabilità, di performance e di uno schema di sviluppo e progettazione flessibile. Ci si soffermerà sui database a grafo (graph-db) descrivendo nel dettaglio l’architettura di hypergraphdb, uno dei graph-db open source più maturi e performanti al momento in circolazione, mostrando anche come sarebbe possibile implementare la persistenza di hypergraphdb su un database diverso dal berkeleydb, come ad esempio cassandra, il più famoso tra i database non relazionali di ultima generazione (utilizzato anche da facebook).