Was tragen wir hier ein?
Jeden Schritt, der Daten einliest und Daten verarbeitet und ein (Zwischen)-Ergebnis produziert. Mit allen Parametern, mit der Version des Codes (Skript), die den Schritt durchgeführt hat, und wo die Ausgabe zu finden ist.
Für unsere komparative Genomik der Bäckerhefe verwenden wir Genome von nahen Verwandten:
- S. cerevisiae - Bäckerhefe
- E. gossypii - Schimmelpilz. Ein Pathogen bei Baumwolle und Zitrusfrüchten. wächst filamentös. Referenz-Genom: https://www.ncbi.nlm.nih.gov/datasets/taxonomy/284811/
- K. lactis - Milchsäuregärung bei Kefir
- N. clabratus - Symbiontischer Pilz des Menschen in den Schleimhäuten. Kann Krankheit bei Immunschwäche verursachen.
- L. thermotolerans - Milchsäuregärung bei niedrigen und hohen Temperaturen. Kommt in natürlich fermentierten Lebensmitteln vor. Wird genannt im Zusammenhang mit Fruchtfliegen (nachlesen).
- L. kluyveri - Verwandter der Bäckerhefe, fermentiert nur in klar anaeroben Bedingungen. Kommt vor in "slime flux" eine Erkrankung von Bäumen in Nordamerika und Europa.
Siehe Skript ./Methods/download_genomes.sh
- S. cerevisiae
- E. gossypii
- K. lactis
- N. clabratus
- L. thermotolerans
- L. kluyveri
Ausführung des Skripts am 20. November 2023
cd Methods
sbatch download_genomes.sh
Betriebssystem: Ubuntu 22.04.3 LTS
Tools:
- phantomjs: 2.1.1
- prot-scriber: 0.1.4
- HMMER: 3.3.1
- openjdk: 18.0.2-ea
- DAGchainer: dbf9f2f
- OrthoFinder: 2.5.5
- slurm-wlm: 21.08.5
- perl: 5.34.0
- blastp: 2.14.0
- python3: 3.10.12
- conda: 23.3.1
- augustus: 3.4.0
- syri: 1.6.5
- plotsr: 1.1.3
- curl: 7.81.0
- pip: 22.3.1
- ete3: 3.1.3
- scipy: 1.11.4
- numpy: 1.26.2
- pysam: 0.22.0
- pandas: 2.1.3
- Cython: 3.0.6
- python-igraph: 0.11.3
- psutil: 5.9.6
- setuptools: 59.6.0
- matplotlib: 3.8.2
- tar: 1.34
- R: 4.3.2
- Rscript: 4.3.2
- venn: 1.11
- admisc: 0.33
- RColorBrewer: 1.1-3
- wordcloud: 2.6
- wordcloud2: 0.2.1
- htmlwidgets: 1.6.3
- webshot: 0.5.5
- minimap2: 2.26-r1175
# setzt erfolgreich abgeschlossene Ausführung von download_genomes.sh voraus
cd Methods
sbatch predict_genes.sh
# predicted genes in ../Results/Prediction
Ausführung des Skripts am 20. November 2023
# setzt erfolgreich abgeschlossene Ausführung von predict_genes.sh voraus
cd Methods
bash compare_prediction_results.sh > ../Results/compare_prediction_results_out.txt
Ausführung des Skripts am 21. November 2023
# setzt erfolgreich abgeschlossene Ausführung von predict_genes.sh voraus
cd Methods
sbatch busco.sh
# BUSCO output in ../Results/Busco
Ausführung des Skripts am 20. November 2023
# setzt erfolgreich abgeschlossene Ausführung von busco.sh voraus
cd Methods
bash busco_results.sh > ../Results/busco_results_out.txt
Ausführung des Skripts am 4. Dezember 2023
# setzt erfolgreich abgeschlossene Ausführung von download_genomes.sh voraus
cd Methods
sbatch detect_transposables.sh
# EDTA output in ../Results/Detected_Transposons
Ausführung des Skripts am 20. November 2023
# setzt erfolgreich abgeschlossene Ausführung von detect_transposables.sh voraus
cd Methods
bash transposables_results.sh > ../Results/transposables_results_out.txt
Ausführung des Skripts am 4. Dezember 2023
# setzt erfolgreich abgeschlossene Ausführung von predict_genes.sh voraus
cd Methods
# das Argument für das Skript ist der Pfad zu 'orthofinder.py' vom OrthoFinder tool
sbatch find_orthologous_genes.sh /media/BioNAS/KOGE_WS_23_24/Methods/OrthoFinder-2.5.5/orthofinder.py
# OrthoFinder results in ../Results/Orthologous_Genes
Ausführung des Skripts am 22. November 2023
# setzt erfolgreich abgeschlossene Ausführung von predict_genes.sh voraus
cd Methods
# das Argument für das Skript ist der Pfad zu 'orthofinder.py' vom OrthoFinder tool
sbatch find_orthologous_genes_with_outgroup.sh /media/BioNAS/KOGE_WS_23_24/Methods/OrthoFinder-2.5.5/orthofinder.py
# OrthoFinder results in ../Results/Orthologous_Genes_With_Outgroup
Ausführung des Skripts am 28. November 2023
# setzt erfolgreich abgeschlossene Ausführung von find_orthologous_genes.sh und find_orthologous_genes_with_outgroup.sh voraus
cd Methods
bash evaluate_detected_orthologs.sh > ../Results/evaluate_detected_orthologs_out.txt
Ausführung des Skripts am 4. Dezember 2023
# setzt erfolgreich abgeschlossene Ausführung von download_genomes.sh voraus
cd Methods
sbatch analyze_syntheny_syri.sh
# SyRi results in ../Results/Syntheny_SyRi with corresponding plot ../Results/syntheny_syri.png
Ausführung des Skripts am 10. Dezember 2023
# setzt erfolgreich abgeschlossene Ausführung von download_genomes.sh voraus
cd Methods
sbatch analyze_syntheny_dagchainer.sh
# DAGchainer results in ../Results/Syntheny_DAGchainer
# Betrachten der Ergebnisse: wenn ssh -> ssh mit -X Option, da Java_XY_plotter X11 DISPLAY braucht
bash plot_syntheny.sh # zeigt alle plots
bash plot_syntheny.sh "Saccharomyces cerevisiae" # zeigt alle plots mit Synthenie zu Saccharomyces cerevisiae
bash plot_syntheny.sh cerev kluy # zeigt alle plots mit Synthenie zwischen Saccharomyces cerevisiae und Saccharomyces kluyveri
Ausführung des Skripts am 17. Dezember 2023
# setzt voraus, dass Material/HMMER/Pfam-A.hmm existiert
cd Methods
sbatch hmmpress.sh
Ausführung des Skripts am 10. Dezember 2023
# setzt erfolgreich abgeschlossene Ausführung von predict_genes.sh voraus
cd Methods
sbatch annotate_proteomes.sh
# Ergebnisse in ../Results/Annotated_Proteomes
Ausführung des Skripts am 10. Dezember 2023
# setzt erfolgreich abgeschlossene Ausführung von annotate_proteomes.sh voraus
cd Methods
sbatch evaluate_annotated_proteomes.sh
# Ergebnisse in ../Results/evaluate_annotated_proteomes_out.txt
Ausführung des Skripts am 11. Dezember 2023
# setzt voraus, dass Material/Diamond/uniprot_trembl.fasta existiert (database release 2023-11-08)
cd Methods
sbatch diamond_makedb.sh
Ausführung des Skripts am 10. Dezember 2023
# setzt erfolgreich abgeschlossene Ausführung von predict_genes.sh und find_orthologous_genes.sh voraus
cd Methods
sbatch prot_scriber.sh
# Ergebnisse in ../Results/Protscriber
Ausführung des Skripts am 11. Dezember 2023
# setzt erfolgreich abgeschlossene Ausführung von prot_scriber.sh voraus
cd Methods
sbatch evaluate_prot_scriber.sh
# Plots in ../Results/*_word_cloud_type_*
Ausführung des Skripts am 11. Dezember 2023
# setzt erfolgreich abgeschlossene Ausführung von find_orthologous_genes.sh voraus
cd Methods
sbatch cafe.sh
Ausführung des Skripts am 9. Januar 2024