ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-02082022-164907


Tipo di tesi
Tesi di laurea magistrale
Autore
MARTINI, GEMMA
URN
etd-02082022-164907
Titolo
Fast Packing of Large Genomic Data
Dipartimento
INFORMATICA
Corso di studi
INFORMATICA
Relatori
relatore Dott. Geraci, Filippo
relatore Dott. Guerrini, Veronica
Parole chiave
  • compression
Data inizio appello
25/02/2022
Consultabilità
Tesi non consultabile
Riassunto
In the form of short genomic reads, associated quality values, and read identifiers High-Throughput Sequencing technologies generate massive volumes of data. General-purpose compressors are unable to fully use much of the inherent redundancy in these FASTQ datasets due to the extensive structure present.
In this thesis, we propose FPLGeD, a lossless tool for packing FASTA and FASTQ files.
File