Monthly Archives: October 2013

neural_data_mining

L'opera ha per obiettivo di presentare e di descrivere nei dettagli gli algoritmi di calcolo per l'estrazione della conoscenza nascosta nei dati utilizzando il linguaggio Python, linguaggio che consente di leggere e capire facilmente la natura e le caratteristiche delle regole di calcolo utilizzate, a differenza di quanto avviene per gli applicativi commerciali forniti solo nella forma di codice eseguibile che restano misteriosi ed inaccessibili a qualsiasi modifica.

Gli algoritmi di calcolo contenuti nell'opera, minutamente descritti, documentati e disponibili in formato sorgente Python, hanno lo scopo di estrarre la conoscenza nascosta nei dati siano essi di tipo testuale o di tipo numerico.

Sono presentati anche diversi esempi di utilizzo, evidenziandone le caratteristiche, le modalità di esecuzione e fornendo i commenti ai risultati ottenuti.

Download KB Neural Data Mining

Sorgenti in Python: http://www.freeopen.org/?p=73

Esempi: http://www.freeopen.org/?p=89

KIndex: http://www.freeopen.org/?p=213

Contact us


Visite:

(1302)

Python-Programming-Language_sources

I 4 programmi in Python: kb_cat.py, kb_cla.py, kb_sta.py kb,_rnd.py  in kb_sources.zip

Nota bene: per ridurre di 7 volte il tempo di esecuzione, soprattutto di kb_cat.py, utilizzare pypy  (pypy.org) al posto di python.

Download kb_sources.zip

Inoltre è disponibile il programma kb_sim.py che consente di calcolare alcuni indici di somiglianza / similarità fra coppie dei gruppi ottenuti dal precedente  programma di catalogazione kb_cat.py.

Per mandarlo in esecuzione:

  • digitare in terminale python kb_sim.py
  • successivamente digitare il nome del file *_outsrt.txt ottenuto dal programma di catalogazione kb_cat.py
  • terminare digitando i nomi dei due gruppi per i quali si vogliono ottenere gli indici di similarità.

Come si può constatare dagli esempi allegati, la coppia dei mammiferi predatori G_03_01 con i mammiferi domestici G_03_00 ha indici di similarità di valore ben maggiore rispetto alle altre coppie.

Utilizzando il programma kb_sim_all.py, ogni gruppo è confrontato con tutti gli altri determinando quanti valori siano identici nelle variabili deile coppie in esame. Minori sono le coincidenze dei valori delle variabili presenti in entrambi i gruppi e maggiormente distinti fra di loro sono i gruppi.

I risultati del programma kb_sim_all.py possono confermare il valore di KIndex ottenuto dal programma kb_cat.py.

Download kb_sim.zip

Inoltre è disponibile il programma kb_pie.py che consente di ottenere un grafico a torta dei CV delle variabili / colonne del gruppo scelto.

CV_G_03_00Per mandarlo in esecuzione:

  • digitare in terminale python kb_pie.py
  • successivamente digitare il nome del file *_cv.txt ottenuto dal programma di catalogazione kb_cat.py
  • terminare digitando il nome del gruppo per il quale si vuole ottenere il grafico a torta dei CV.

Download kb_pie.zip

Inoltre è disponibile il programma kb_pie_cv.py che consente di ottenere un grafico a torta delle variabili / colonne evidenziandone il contributo a caratterizzare i gruppi attraverso il rapporto fra i CV dopo la catalogazione e i CV prima della catalogazione.

animals_cvPer mandarlo in esecuzione:

  • digitare in terminale python kb_pie_cv.py
  • successivamente digitare il nome del file *_cv.txt ottenuto dal programma di catalogazione kb_cat.py

Download kb_py_cv.zip

Contact us


Visite:

(1471)

iris_groups

Sono disponibili diversi esempi di utilizzo di KB_CAT con relativi output.

animali Animali da catalogare

biblio_rionali Prestiti nelle Biblioteche rionali

cancer Tumori al seno

censimento Censimento popolazione in Lombardia

contenitori Contenitori da catalogare

credit_rating Valutazione del fido

credit_score Valutazione del fido

gender_inequality Disuquaglianza di genere

heart Disturbi cardiaci

houses Caratteristiche delle abitazioni

iris Catalogazione dei fiori iris

mammal_size Dimensioni dei mammiferi

prestiti_biblio Prestiti nelle biblioteche

quart_milano Abitanti nei quartieri di Milano

ricettivita_turistica Ricettività turistica in Piemonte

running_records Record di corsa piana

sardegna_comuni_integrati Servizi nei comuni della Sardegna

sondaggio Sondaggio politico

student_scores Valutazione degli studenti

tecnologia Uso delle tecnologie

virusb Malattie epatiche

water_quality Qualità dell'acqua

wines Caratteristiche del vino

Contact us


Visite:

(1358)

kb_inglese_copertina

The aim of this book is to present and describe in detail the algorithms to extract the knowledge hidden inside data using Python language, which allows us to read and easily understand the nature and the characteristics of the rules of the computing utilized, as opposed to what happens in commercial applications, which are available only in the form of running codes, which remain impossible to modify.

The algorithms of computing contained within the book are minutely described, documented and available in the Python source format, and serve to extract the hidden knowledge within the data whether they are textual or numerical kinds. There are also various examples of usage, underlining the characteristics, method of execution and providing comments on the obtained results.

Download KB_neural_data_mining

Python sources: http://www.freeopen.org/?p=73

Examples: http://www.freeopen.org/?p=89

KIndex: http://www.freeopen.org/?p=213

Know4Business - Neural Data Mining in Google App Engine - Tutorial

Know4Business in GAE Cloud provides six tools:

  • SOURCE to acquire and maintain records to process available in tabular form
  • CATALOGUE to catalog the sources, with an algorithm based on the theory of neural networks (Kohonen)
  • STATISTICS to perform statistical analysis, to explore the goodness of classification, in addition to the results of the cataloging function (see SHOW)
  • CLASSIFIER to classify new entities "on the fly", using the training matrix function obtained from the previous catalog
  • SHOW   to   view   the   reports,   analytical   and   descriptive   summary   of   the   groups   created   by   cataloging   and classification
  • CHART that displays a vertical bar graph in the CV (coefficient of variation) of the variables / columns of the identified groups

Download know4business_tutorial

Contact us


Visite:

(5708)

Achieved cataloging into groups by a SOM neural network, the question arises
whether or not there is knowledge in the groups, namely whether the groups are between them distinct and have homogeneous characteristics within each group.
The use of the coefficient of variation (CV) can be of help.
KINDEX (Knowledge Index) is an index that measures how much knowledge is
contained in the groups obtained from the SOM neural network: in the case KINDEX
reaches the maximum value of 1, each group would consist of records with constant
values ​​in all the variables / columns, and each group would be quite distinct
from other groups.
KINDEX is calculated using the weighted-average CV of variables / columns
groups, comparing them to the CV of the variables / columns of the input file before
cataloging.
************************************************************************

Coef_of_Var

Ottenuta la catalogazione in gruppi da una rete neurale di tipo SOM, sorge il dubbio
se nei gruppi esista o meno della conoscenza, ossia se i gruppi sono fra di loro
distinti e con caratteristiche omogenee all'interno di ogni gruppo.
L'utilizzo del coefficiente di variazione (CV) può essere di aiuto.
KIndex (Knowledge Index) è un indice che misura quanta conoscenza sia
contenuta nei gruppi catalogati: nel caso KIndex raggiunga il valore massimo di 1,
ogni gruppo sarebbe composto da record con valori costanti in tutte le variabili /
colonne e renderebbe ogni gruppo del tutto distinto dagli altri gruppi.
KIndex è calcolato utilizzando i CV medi-ponderati delle variabili / colonne dei
gruppi rapportandoli al CV delle variabili / colonne del file di input prima della
catalogazione.

Download kindex_clubti.pdf

Download kindex_articolo2_eng.pdf

Download kindex_py

Contact us


Visite:

 

(928)

giustizia

Il libro contiene consigli pratici per chi volesse intraprendere la professione di Ctu (Consulente Tecnico di Ufficio) o di Ctp (Consulente Tecnico di Parte).
Contiene anche molti consigli legali, tecnici e di buon senso informatico utili a prevenire inutili e lunghi contenziosi.
L'esposizione dei temi trattati è volutamente semplice nei limiti consentiti dagli argomenti legali e informatici citati.
Le pagine sono il concentrato di quindici anni di esperienza presso il Tribunale di Milano sia come Ctu sia come Ctp.
La nuova edizione contiene nuovi capitoli dedicati all'Analisi forense, alla Perizia giurata / asseverata e alla sicurezza informatica nelle Imprese e nella Pubblica Amministrazione  e al Regolamento interno per dipendenti e collaboratori.

Download La perizia informatica

Contact us


Visite:

(1235)