Quina diferència hi ha entre un gràfic de coneixement i una base de dades de gràfics?


Resposta 1:

"Knowledge Graph" i "Graph Database" són dos termes orientats al màrqueting (frases buzz) associades a la representació estructurada de dades (re Knowledge Graph) i als sistemes de gestió de bases de dades (torna a la base de dades gràfica).

L’aspecte “gràfic” d’aquestes frases de buzz es refereix a un model de relació d’entitat que normalment es representa com a un quadre gràfic (diagrama de xarxa o web).

L’aspecte “coneixement” d’aquestes frases de buzz és tot sobre la semàntica de tipus de relació d’entitat (Relations) expressada en un model de relació d’entitat.

Un "gràfic de coneixement" és bàsicament la naturalesa de les dades estructurades (organitzades com a document de base de dades) gestionades per "Sistemes de gestió de bases de dades gràfiques" utilitzant diversos llenguatges de consulta declarativa (alguns d'aquests es basen en estàndards oberts, per exemple, SQL, SPARQL, mentre que d’altres són propietaris i específics del producte, per exemple, Cypher i altres).

Per què tenim aquestes frases punyents?

Els venedors del sistema de gestió de bases de dades relacionals (RDBMS) basen bàsicament el model relacional original de Edgar Codd mitjançant el que es van convertir en les 12 Codd (en realitat 13 articles a causa de la indexació basada en zero).

Malauradament, l’esforç anterior va desviar la naturalesa genèrica de l’original model relacional abstracte de Codd en un model específic d’implementació on les relacions es representen d’una manera específica en lloc de genèrica, és a dir, N-Tuples (representades com a Taules) on cada membre de la relació és identificat exclusivament per un Clau primària: que és contrària al model relacional genèric que només requereix que les dades s’expressin com a relacions que inclouen Tuples.

Les Tuples poden adoptar diverses formes que inclouen: N-Tuples (allò que ofereixen la majoria de productes RDBMS), 3-Tuples (què ofereixen els productes SGBD compatibles amb RDF), 4-Tuples (què és el que els productes SGBD compatibles amb RDF [R]) que admet els gràfics anomenats), i altres.

L’efecte net de tot això ha donat lloc a un nou subgènere DBMS anomenat No només el SQL (NoSQL) al qual pertanyen les “Bases de dades gràfiques”.

Model de relació d'entitat (representat com a gràfic)

Esquema de definició de bases de dades relacional (representades a Taules)

Gèneres SGBD tabulats

L'aparició de NoSQL ha donat lloc naturalment a una extensió dels gèneres de DBMS tal com es mostra a la taula següent:

Feu clic aquí per obtenir una vista detallada de la tabulació de gènere DBMS revisada.

Exemples de gràfics de coneixement?

A partir de la meva experiència personal com a participació en projectes, a continuació, es mostren alguns exemples de gràfics de coneixement que són de lliure accés i accessibles per a qualsevol persona equipada amb un dispositiu informàtic que admeti el protocol HTTP, és a dir, un dispositiu capaç de buscar i explorar el coneixement com a resposta a un clic de l'acció de l'usuari:

  • Núvol de dades obertes enllaçades (plantades per DBpedia): es tracta d’un KnowledgeBase distribuït (o gràfic de coneixement) que inclou dades estructurades desplegades mitjançant principis de Dades enllaçades (és a dir, un model de relació d’entitat on Entitat, atribut i valor [opcionalment] s’identifiquen mitjançant hiperenllaços [ és a dir, URI HTTP]).

Cada node del núvol anterior està associat a un domini de coneixement i completament explorable per interaccions de clic humà i / o recerques d’agents de programari mitjançant consultes SPARQL o SQL.

Relacionat

  • Un model relacional de dades per a grans bancs de dades compartides - paper seminal d'Edgar CoddCodd i el model relacional Model RelationalEntity Relationship - Vers una visió unificada de les dades - Paper seminal de Peter Chen Grafic conceptual per a una interfície de bases de dades - Paper seminal de John F. Sowa Base de dades de gràfics ”fraseQuè és DBpedia i per què és important? Què és el núvol obert de dades enllaçat i per què és important? Què és Dades petites i per què és important? Glossari

Resposta 2:

Una base de dades de gràfics (sovint) és un reemplaçament d'un gràfic de coneixement.

Gràfic de coneixements: un gràfic de coneixement és una base de coneixement que es pot llegir de la màquina amb l'ajuda de gràfics enllaçats coherent i lògicament que constitueixen un grup de fets interrelacionats. Un gràfic en aquest context podria ser, per exemple, un conjunt de triples de RDF enllaçats.

Un triple triple RDF representa el coneixement humà en forma estàndard i llegible per màquina enllaçant un subjecte, un verb i un objecte (S-V-O), coneguts entre ells. Aquests triples s’assemblen a frases simples de llenguatge humà S-V-O, llegibles per màquina, com Ian coneix a Mary.

Exemple de triple RDF. Des de "L'API principal de RDF", Documentació Apache Jena, 2011-2019.

Al mateix temps, aquesta representació RDF també es pot visualitzar visualment com a nodes (subjectes i objectes) i arestes (verbs o predicats) de gràfics.

Quan forma part d’un gràfic de coneixement operatiu de bona fe, aquest tipus de triples també pot ser una declaració de fet llegible per màquina.

Els fets triplificats enllaçats de manera lògicament coherent mitjançant el gràfic de coneixement tenen un poder de raonament. Quan s'adhereixen lògicament, s'afegeixen triples de fet al gràfic, les màquines poden inferir nous enllaços o connexions. connexions que es poden descobrir per part de les màquines humanes. Les màquines poden oferir accés a les dades en aquests triples enllaçats, gràfics de coneixement o fets entrellaçats com a part d’un servei d’informació.

Google va començar a oferir serveis d'informació basats en gràfics de coneixement durant els anys 2010 després d'adquirir Freebase el 2010. Google de fet va encunyar el terme "coneixement del gràfic", terme que es va popularitzar per primera vegada el 2012.

Diguem en el nostre exemple que Ian coneix a Mary perquè tots dos van a la línia d'autobús 23 VTA (Valley Transportation Authority) els dies laborables. I que un cop van agafar el mateix autobús fins a la mateixa parada, van descobrir que tots dos treballen al mateix lloc.

Si Google té permís per fer el seguiment d'ubicació a través d'un telèfon intel·ligent de Mary i Ian, es pot deduir dels detalls de seguiment d'ubicació que cadascun funciona al mateix lloc.

Maria, per exemple, pot aprendre què sap Google sobre ella, donant permís a Google per fer el seguiment i, a continuació, veure què fa Google Maps. Google Maps després de fer el seguiment de Mary dia a dia conclou que va a una ubicació laboral els dies laborables i, en algun moment després de la feina, torna generalment a una ubicació de casa. Google mostrarà aquests fets inferits al telèfon intel·ligent de Maria quan utilitzi Google Maps.

A causa de consideracions de privacitat i decisions de disseny, Google no mostra a Mary que Ian treballi al mateix lloc on treballa Mary. Però hi ha aplicacions de xarxes socials que, donats els permisos adequats, proporcionen aquest tipus de coneixement.

Base de dades de gràfics: les bases de dades gràfiques s’utilitzen sovint per emmagatzemar dades de gràfics de coneixement. Per Viquipèdia,

  • “Una base de dades és una col·lecció organitzada de dades, generalment emmagatzemades i accedides electrònicament des d’un sistema informàtic.” “Una base de dades gràfica és una espècie de base de dades NoSQL que utilitza estructures gràfiques amb nodes, arestes i propietats per representar i emmagatzemar informació. Les bases de dades de gràfics generals que poden emmagatzemar qualsevol gràfic es diferencien de les bases de dades gràfiques especialitzades, com ara els triplestors i les bases de dades de xarxa. "

Sistema de gestió de bases de dades: per Viquipèdia,

  • "Formalment, una" base de dades "fa referència a un conjunt de dades relacionades i a la forma d'organitzar-se. L’accés a aquestes dades sol estar proporcionat per un ‘sistema de gestió de bases de dades’ (DBMS) que consisteix en un conjunt integrat de programari informàtic que permet als usuaris interactuar amb una o més bases de dades i permet accedir a totes les dades que conté la base de dades (encara que restriccions pot haver-hi limitacions d’accés a determinades dades). El SGBD ofereix diverses funcions que permeten l’entrada, l’emmagatzematge i la recuperació de grans quantitats d’informació i proporciona maneres de gestionar com s’organitza aquesta informació. “A causa de l’estreta relació entre ells, el terme“ base de dades ”s’utilitza sovint per referir-se a tots dos. una base de dades i el SGBD utilitzats per manipular-la. "

De base de dades - Viquipèdia, 2019

DB-Engines va fer un seguiment de 32 DBMS gràfics diferents a juny de 2019. Entre els 12 primers llocs en aquest punt es trobaven les DBMS de gràfics de propietat com ara Neo4j i Arango DB i RDF quadres com Allegrograph, Virtuoso i Stardog. Vegeu el rànquing DB-Engines per a la classificació actual.

El 2019, el World Wide Web Consortium (W3C) va iniciar el procés d’estandardització de dades de gràfics, un esforç per reunir i permetre la conversió estàndard de dades gràfiques d’un formulari a un altre, dades representades de maneres diferents, com en els gràfics de propietat, RDF, o en forma relacional. Consulteu el taller W3C sobre normalització web per obtenir dades gràfiques

Algunes organitzacions han creat gràfics de coneixement mitjançant la tecnologia de bases de dades relacionals i qualsevol gràfic es pot representar en forma de base de dades relacional. Però les bases de dades gràfiques han esdevingut populars a causa del major estatus que han donat a les dades de relació (és a dir, els verbs de les oracions). Irònicament, les dades de relacions sovint han estat enterrades o desaparegudes en bases de dades relacionals. On serien la lògica i el llenguatge humans si faltessin els verbs de les nostres frases?

Les dades de relacions són fonamentalment importants per a la integració i la interoperació a gran escala inherents a la computació contextual, i la creació i la gestió d’aquests contextos de maneres flexibles i escalables mitjançant la realització de relacions explícites s’ha convertit en fonamental per a la integració a gran escala i el desil·lació necessària per a la recerca d’artificial general. intel·ligència

Vegeu la descripció de John Launchbury de les tres fases de la IA per obtenir més detalls sobre la informàtica contextual i la fase contextual de la IA.

Cada vegada són més les empreses que creen gràfics de coneixement com a mitjà per ampliar els esforços de la IA. Vegeu l’exemple de comerç electrònic a Per què els gràfics de coneixement són fonamentals per a la intel·ligència artificial, per exemple.

Gràcies per l'A2A, Terri Gilbert.