Probabilistic algorithm for mining frequent sequences

Julija  Pragarauskaitė; Gintautas  Dzemyda

doi:10.15388/LMR.2010.57

Articles

Julija Pragarauskaitė

Matematikos ir informatikos institutas

Gintautas Dzemyda

Matematikos ir informatikos institutas

Published 2010-12-21

https://doi.org/10.15388/LMR.2010.57

PDF

Keywords

frequent sequence mining
probabilistic algorithm
data mining

How to Cite

Pragarauskaitė, J. and Dzemyda, G. (2010) “Probabilistic algorithm for mining frequent sequences”, Lietuvos matematikos rinkinys, 51(proc. LMS), pp. 313–318. doi:10.15388/LMR.2010.57.

Download Citation

Abstract

Frequent sequence mining in large volume databases is important in many areas, e.g., biological, climate, financial databases. Exact frequent sequence mining algorithms usually read the whole database many times, and if the database is large enough, then frequent sequence mining is very long or requires supercomputers. A new probabilistic algorithm for mining frequent sequences is proposed. It analyzes a random sample of the initial database. The algorithm makes decisions
about the initial database according to the random sample analysis results and performs much faster than the exact mining algorithms. The probability of errors made by the probabilistic algorithm is estimated using statistical methods.

PDF

References

Downloads

Download data is not yet available.

Most read articles by the same author(s)

Audronė Lupeikienė, Albertas Čaplinskas, Gintautas Dzemyda, Problems of portal users behaviour specification , Lietuvos matematikos rinkinys: Vol. 50 (2009)
Gintautas Dzemyda, Olga Kurasova, Vydūnas Šaltenis, Vytautas Tiešis, The analysis of the Lithuanian teacher's databases in the scope of mathematics' teaching , Lietuvos matematikos rinkinys: Vol. 41 (2001)
Gintautas Dzemyda, Jolita Bernatavičienė, Olga Kurasova, Virginijus Marcinkevičius, Strategies of minimization of Sammon's mapping error , Lietuvos matematikos rinkinys: Vol. 44 (2004)
Gintautas Dzemyda, Olga Kurasova, Visualization of multidimensional data taking into account the learning flow of the self organizing neural network , Lietuvos matematikos rinkinys: Vol. 42 (2002)
Gintautas Dzemyda, Olga Kurasova, Virginijus Marcinkevičius, Parallelization in combining the SOM and Sammon's mapping , Lietuvos matematikos rinkinys: Vol. 43 (2003)
Tomas Petkus , Gintautas Dzemyda, Optimal selection of the nutritive value , Lietuvos matematikos rinkinys: No. II (1998)
Viktor Medvedev, Gintautas Dzemyda, Mapping error in the parallel realizations of SAMANN algorithm , Lietuvos matematikos rinkinys: Vol. 44 (2004)
Viktor Medvedev, Gintautas Dzemyda, Optimization of the learning rate in the algorithm for data visualization , Lietuvos matematikos rinkinys: Vol. 45 (2005)
Gintautas Dzemyda, Gražvydas Leonavičius, Audrius Našlėnas, Analysis of the mathematics and informatics studies in Vilnius Pedagogical University , Lietuvos matematikos rinkinys: No. II (1998)