Graph analytics and Network data

Saida mak Grafiku?

Gráfiku maka konjuntu ida hosi vértice sira ne'ebé maka liga ho ninin sira. Vertices sira dala barak mós koñesidu hanesan nodu sira, no borda sira dalaruma hanaran ligasaun sira, relasaun sira ka arku sira. Porezemplu, rede sosiál sira reprezenta ligasaun sira entre ema sira. Ezemplu sira seluk inklui rede transporte sira, hanesan ligasaun voo, komboiu, ka autokarru entre sidade sira, no rede telekomunikasaun sira, hanesan kabel sira ne'ebé lori tráfiku internet entre servidór sira. Prosesamentu gráfiku mós baibain uza iha área sira hanesan deteksaun fraude ka ameasa no rekomendasaun produtu. Problema negósiu barak hetan benefísiu hosi komprensaun no análize ida kona-ba rede sira liuhosi prosesamentu gráfiku, no ida-ne'e maka'as liu bainhira kombina ho tékniku analítiku sira seluk, inklui aprendizajen mákina.

Diagrama hatudu ezemplu simples ida. Nodu sira iha rede ida-ne'e maka nasaun 6 iha Europa osidentál no sentrál. Liña sira, ka ninin sira, iha diagrama hatudu katak nasaun rua fahe fronteira ida.

Ilustrasi Fase NLP Graph Analytics

Databricks Runtime ML inklui pakote análize rede nian ba problema sira iha eskala saida de'it. Ba rede sira ne'ebé relativamente ki'ik ne'ebé bele prosesa iha nodu komputasaun ida de'it, uza NetworkX. Ba rede boot sira ne'ebé presiza prosesamentu distribuidu, uza GraphFrames. Ita-boot mós bele instala pakote open source adisionál sira bainhira presiza, ka liga ba parseiru esternu sira no ferramenta sira ba prosesamentu gráfiku no vizualizasaun.

Nodes and edges

Iha análize rede nian, rede ida, ka gráfiku, kompostu hosi konjuntu ida hosi nodu sira no konjuntu ida hosi aresta sira, ka ligasaun sira, ne'ebé liga nodu sira. Nodu sira reprezenta sasán sira ne'ebé maka liga, hanesan ema ka sidade sira. Borda sira reprezenta ligasaun ka relasaun sira entre sira, hanesan ema sira ne'ebé serbisu hamutuk, ka estasaun komboiu sira ne'ebé iha ligasaun direta entre sira. Node sira mós hanaran vértices, pontu sira, ka entidade sira. Borda sira mós hanaran liña sira, relasaun sira, ka ligasaun sira.

Network and node properties

1. Shortest path

Dalan badak liu maka distánsia mínimu entre nodu rua, hodi konsidera ligasaun diresionál sira no, opsionalmente, pezu sira iha ninin. Porezemplu, iha diagrama anteriór, dalan badak liu entre nodu sira Alemaña no España maka liuhosi Fransa, ba distánsia dalan 2.

2. Centrality

Sentralidade maka maneira ida atu sukat importánsia hosi nodu ida iha rede ida. Iha sasukat oioin kona-ba sentralidade. Grau sentralidade husi nodu ida bazeia ba frasaun husi nodu sira iha rede ida ne'ebé nodu ne'e liga diretamente ba. Sentralidade entre nodu ida maka frasaun hosi dalan badak liu iha rede ida ne'ebé liuhosi nodu.

3. Degree distribution

Distribuisaun grau rede ida nian maka númeru hosi nodu sira hosi grau ida-idak. Ida-ne'e fornese informasaun kona-ba estrutura no organizasaun rede nian.

4. Diameter

Diámetru rede ida nian maka másimu hosi dalan badak liu entre nodu rua. Diámetru hanesan ho eksentrisidade másimu hosi nodu sira iha rede ida.

5. Density

Densidade gráfiku ida maka númeru ninin sira iha gráfiku fahe ba númeru totál ninin sira ne'ebé posivel. Ba gráfiku ida ne'ebé la diresionadu, númeru totál hosi aresta posivel sira maka n(n-1)/2, iha ne'ebé n maka númeru hosi nodu sira. Ba gráfiku diresionadu, ninin ida-idak iha diresaun rua ne'ebé posivel, nune'e númeru totál ninin posivel sira maka n(n-1).

Basic graph analysis using NetworkX notebook