O LBB está localizado na Embrapa Agroenergia, em Brasília/DF, no térreo do Bloco D. Inclui duas salas: a principal, onde está a equipe de bioinformática e desenvolvimento de sistemas, com seis estações de trabalho de alto desempenho, e a sala de apoio, para usuários avançados, com seis estações de trabalho (três rotativas do LBB e três de parceiros).
Nosso rack está no CPD da unidade, e inclui cinco servidores físicos, dois storages e um robô de backup. Dois destes servidores estão alocados como ambientes de virtualização para diversas máquinas virtuais com fins específicos, e os outros 3 são utilizados diretamente para análises de bioinformática.
Hardware
Servidores de alto desempenho:
- Dell PowerEdge R930 EMC (2018), GNU/Linux (128 Threads, 1TB RAM).
- Dell PowerEdge R930 (2015), 4 x Processadores Intel Xeon E7-4850 v3 (14 Núcelos / 28 Threads), Memória 256 GiB DDR4, 8 un. SAS 1.200 GB em RAID5, GNU/Linux.
- HP ProLiant DL585 G7 (2009), 4 x Processadores AMD Opteron 6344 (12 Núcleos), Memória 384 GiB DDR3, 4 un. SAS 300 GB em RAID5, GNU/Linux;
Servidores secundários
- HP ProLiant DL380 G5 (2009), 2 x Processadores Intel Xeon E5430 (4 Núcleos), Memória 16 GiB DDR2, 5 un. SAS 146 GB em RAID5, Debian GNU/Linux;
- HP ProLiant DL380 G7 (2009), 2 x Processadores Intel Xeon E5630 (4 Núcelos / 8 Threads), Memória 32 GiB DDR3, 3 un. SAS 300 GB em RAID5, Debian GNU/Linux.
Storages
- Dell ME4012
- Dell SCv2000
- HP P2000 G3.
Docker containers
- (SG) Banco de Dados PostgreSQL
- (SG) Banco de Dados MySQL
- Monitoramento de Ativos Zabbix
- Servidor de Aplicação Web (Python/PHP)
- Backup Bacula
- Proxy Reverso
Software
Nossos servidores rodam com SO Linux, e utilizamos ferramentas computacionais de uso livre.
As ferramentas variam com a demanda, mas podemos citar algumas das mais utilizadas:
- QC (Controle de Qualidade): FastQC + NGS QC;
- Montagem (de genomas): AllPaths-LG, Masurca;
- Anotação (de genomas): Maker;
- Visualização (de genomas): jBrowse;
- Mapeamento (de sequências): BWA, Bowtie;
- Descoberta de SNPs: Freebayes, GATK e Samtools;
- Repetições (TEs e SSRs): pipeline próprio, incluindo TRF + TRAP, Repeat Modeler, Repeat Finder, Repeat Masker etc;
- Desenvolvimento Web: Django (Framework Web em Python);
- Linguagens de programação: Perl, Python (Biopython), C/C++;
- Virtualização: KVM;
- Monitoramento de infraestrutura: Zabbix;
- SGDBs: PostgreSQL e MySQL;
- Backup: Bacula;
- Servidor web: NGINX;
- Controle de Versão: Git e Subversion.