Quina diferència hi ha entre informàtica i ciències de dades?


Resposta 1:

L’informàtica, en termes d’informàtica estadística, és l’estudi de la informació (de qualsevol tipus) mitjançant algoritmes de naturalesa matemàtica i estadística. En realitat no s’utilitza com a paraula en aquest sentit: el més proper que puc pensar és la bioinformàtica. El nom més estàndard per a això és l'aprenentatge de la teoria.

La informàtica, en informàtica, és l'estudi teòric de la informació, algoritmes i informàtica.

Bviament, tots dos són importants a tenir en compte en qualsevol aplicació de ciències de dades, que encara està força mal definida, però generalment es va acordar que sigui un híbrid d’estadístiques, programacions, coneixements teòrics i aplicats (generalment empresarials), matemàtiques i un tot. nombroses coses. Una de les definicions més aptes d’un científic científic de dades que conec és que encara coneix més estadístiques que un programador i més programació que un estadístic ... que, per definició, és molt nebulós.

Si podem coincidir, com a mínim, en què el que fa un científic de dades és resoldre problemes amb les dades, la primera definició d’informàtica s’inscriu bastant dins del terreny de la majoria de la ciència de dades, mentre que la segona és important tenir en compte (especialment per a algú. que és molt minuciós).


Resposta 2:

A continuació, es mostra la meva resposta per a la pregunta: quina diferència hi ha entre informàtica i ciències de dades?

25 millors consells per aconseguir un científic PRO de dades!

Hola amics, he treballat en una empresa de caça cap des del 2014, principal camp en ciències de dades, IA, aprenentatge profund ... Permeteu-me que comparteixi consells sorprenents per convertir-me en científic com a professional. Espero que us agradi. (ref de kdnuggets).

1. Aprofiteu fonts de dades externes: tuits sobre la vostra empresa o els vostres competidors o dades dels vostres proveïdors (per exemple, butlletins personalitzables estadístiques eBlast disponibles a través dels taulers de proveïdors o mitjançant l'enviament d'un bitllet)

2. Els físics nuclears, enginyers mecànics i experts en bioinformàtica poden convertir-se en grans científics de dades.

3. Indiqueu el vostre problema correctament i utilitzeu mètriques sonores per mesurar el rendiment (a la línia de base) proporcionades per les iniciatives de ciències de dades.

4. Utilitzeu les KPIs adequades (mètriques clau) i les dades de dades correctes des del començament, en qualsevol projecte. Els canvis per fonaments dolents són molt costosos. Això requereix una anàlisi minuciosa del vostre daata per crear bases de dades útils.

5. Ref aquest recurs: 74 secrets per convertir-se en científic de dades pro

6. Amb grans daata, els senyals forts (extrems) solen ser sorolls. Aquí teniu una solució.

7. Big data, a té menys valor que la data útil, a.

8. Utilitzeu grans bases de dades, proveïdors de tercers, per obtenir informació intel·ligent.

9. Podeu crear eines barates, excel·lents, escalables i robustes bastant ràpidament, sense utilitzar ciències estadístiques antigues. Penseu en tècniques lliures de models.

10. Big dat, és més fàcil i menys costós del que creieu. Obteniu les eines adequades! A continuació us detallem com començar.

11. La correlació no és causalitat. Aquest article us pot ajudar en aquest problema. Llegiu també aquest bloc i aquest llibre.

12. No heu d’emmagatzemar de forma permanent totes les vostres dades. Utilitzeu tècniques de compressió intel·ligent i guardeu resums estadístics només per a dades antigues, a.

13. No oblideu ajustar les mètriques quan canvieu els vostres canvis, per mantenir la coherència per als propòsits de tendència.

14. Es pot fer molt sense da, tabases, especialment per a da, ta.

15. Incloeu sempre EDA i DOE (anàlisi exploratòria / disseny d’experiment) des de qualsevol moment en qualsevol projecte de ciència. Creeu sempre un diccionari da, ta. I seguiu el cicle de vida tradicional de qualsevol projecte de ciència.

16. Da, ta es pot utilitzar per a diversos propòsits:

- garantia de qualitat

- trobar patrons actuables (borsa comercial, detecció de fraus)

- per a la seva revenda als clients comercials

- per optimitzar decisions i processos (investigació operativa)

- per a la investigació i descobriment (IRS, litigi, detecció de fraus, anàlisis de causes primàries)

- comunicació màquina a màquina (sistemes de licitació automatitzats, conducció automatitzada)

- prediccions (prediccions de vendes, creixement i prediccions financeres, clima)

17. No anul·leu l'Excel. Abraça les analítiques de llum. Models, ta + models + sentiments intestinals + intuïció és la barreja perfecta. No suprimiu cap d'aquests ingredients en el procés de decisió.

18. Aprofiteu la potència de les mètriques compostes: KPI derivats de camps da, tabase, que tenen un poder de predicció molt millor que les mètriques d base de dades originals. Per exemple, el vostre, tabase pot incloure un camp de paraules clau únic, però no discrimina entre la consulta de l’usuari i la categoria de cerca (de vegades perquè d, ata prové de diverses fonts i es combina entre si). Detecteu el problema i creeu una nova mètrica anomenada tipus de paraula clau o font d, ata. Un altre exemple és la categoria d’adreça IP, una mètrica fonamental que s’ha de crear i afegir a tots els projectes d’analítica digital.

19. Quan necessiteu un processament real en temps real? Quan la detecció de fraus és crítica o quan es processen d, transaccions sensibles de transacció (detecció de frau amb targeta de crèdit, trucades de 911). A banda d’això, les analítiques retardades (amb una latència d’uns segons a 24 hores) són prou bones.

20. Assegureu-vos que la vostra d, sensible sensible està ben protegida. Assegureu-vos que els pirates informàtics no puguin ser manipulats pels vostres algorismes (espiar el vostre negoci i robar tot el que poden, legalment o il·legalment, i posar en perill els vostres algorismes, cosa que es tradueix en una gran pèrdua d'ingressos). A la secció 3 d’aquest article es pot trobar un exemple de pirateria empresarial.

21. Combina diversos models per detectar molts tipus de patrons. Prometeu aquests models. A continuació, es mostra un exemple senzill de combinació de models.

22. Feu les preguntes més adequades abans de comprar programari.

23. Executar simulacions de Monte-Carlo abans de triar entre dos escenaris.

24. Utilitzeu diverses fonts per a la mateixa d, ata: la vostra font interna i d, ata d’un o dos venedors. Comprendre les discrepàncies entre aquestes diverses fonts, per tenir una millor idea del que haurien de ser els nombres reals. De vegades, es produeixen grans discrepàncies quan un dels venedors canvia una definició de mètrica o canvia internament, o quan les dades canvien (alguns camps ja no es fan un seguiment). Un exemple clàssic són les dades de trànsit web: utilitzeu fitxers de registre interns, Google Analytics i un altre proveïdor (per exemple, Accenture) per fer el seguiment d’aquestes dades.

25. El lliurament ràpid és millor que la precisió extrema. Tots els conjunts de dades són bruts de totes maneres. Trobeu el compromís perfecte entre la perfecció i el retorn ràpid.