O guia do insideHPC de genômica -...

9
O guia do insideHPC de genômica UM OFERECIMENTO DA

Transcript of O guia do insideHPC de genômica -...

Page 1: O guia do insideHPC de genômica - i.dell.comi.dell.com/sites/doccontent/shared-content/data-sheets/pt/... · Guia de genômica . Leia mais estudos de caso em | 508-259-8570 ... de

O guia do insideHPC de

genômica

UM OFERECIMENTO DA

Page 2: O guia do insideHPC de genômica - i.dell.comi.dell.com/sites/doccontent/shared-content/data-sheets/pt/... · Guia de genômica . Leia mais estudos de caso em | 508-259-8570 ... de

Leia mais estudos de caso em www.insidehpc.com | 508-259-8570 | [email protected]

Introdução Há momentos em que ocorre uma convergência de tecnologias que pode beneficiar um número muito grande de pessoas para melhorar seu bem-estar. Várias inovações tecnológicas que podem aprimo-rar significativamente a recuperação de doenças potencialmente letais e prolongar e melhorar a qualidade de vida estão se reunindo.

Com uma combinação do sequenciamento genô-mico mais rápido e preciso, sistemas de compu-tador mais rápidos e novos algoritmos, a ação de descobrir qual medicamento funcionará melhor em pacientes específicos passou de instituições de pesquisa para os médicos junto aos leitos. Agora, os médicos e outros fornecedores de serviços de saú-de possuem dados e ferramentas melhores, mais rápidos e mais precisos para determinar os planos de tratamento ideais com base em mais dados do paciente. Isso vale em especial para pacientes de câncer pediátrico. Essas tecnologias em rápida evo-lução se tornaram o centro de um esforço nacional para ajudar milhões de pessoas a superar certas do-enças. "Esta noite lançarei um novo programa Pre-cision Medicine Initiative para nos aproximar ainda mais da cura de doenças como câncer e diabetes, e para proporcionar a todos nós o acesso às informa-

Conteúdo Introdução .........................................2Benefícios para organizações ............3

Inovação ..........................................3Liderança .........................................3Resultados dos pacientes ................3Capacitação .....................................3

Desafios .............................................4 Percepção ........................................4ROI para casos de uso pequenos ....4Conformidade com FDA e CLIA .......4 Segurança ����������������������������������������4Práticas médicas .............................4Gerenciamento de dados ...............4

ções personalizadas necessárias para nos manter-mos, e manter nossas famílias, mais saudáveis", de-clarou o Presidente Obama no discurso do Estado da União de 2015 em janeiro. Isso foi seguido por um discurso na Casa Branca sobre vários detalhes do programa. Da planilha de informações da Casa Branca sobre essa proposta, "Com base no anúncio do Presidente Obama em seu Discurso do Estado da União, a Administração revelará hoje detalhes sobre o programa Precision Medicine Initiative, um novo esforço de pesquisa ousado para revolucionar como melhoramos a saúde e tratamos doenças"�

A medicina personalizada (ou "de precisão" de acordo com o Presidente Obama) detém a chave para abordagens inovadoras para tratar doenças em um nível individual. Várias decisões relacio-nadas ao tratamento da assistência médica para cada indivíduo serão personalizadas, com base no conhecimento sobre as informações celulares ou genéticas da pessoa. O diagnóstico de doenças, o tratamento e o uso de medicamentos pode ser fei-to sob medida para cada pessoa. No entanto, há diversos desafios conforme esse campo avança, como a supervisão regulatória, direitos de proprie-dade intelectual e privacidade do paciente.

Êxitos ............................................... 5 Neuroblastoma andMedulloblastoma Translational Research Consortium (NMTRC) ..... 5TGen .............................................. 6 Center For Rare Childhood Diseases (C4RCD) .......................... 6

Solução Dell e Intel ....................7Dell GDAP ...................................... 8

Referências ...................................... 9

2

Guia de genômica

Page 3: O guia do insideHPC de genômica - i.dell.comi.dell.com/sites/doccontent/shared-content/data-sheets/pt/... · Guia de genômica . Leia mais estudos de caso em | 508-259-8570 ... de

Leia mais estudos de caso em www.insidehpc.com | 508-259-8570 | [email protected]

Benefícios para organizações Além dos benefícios óbvios para as pessoas, que receberão diagnósticos e tratamentos mais direcio-nados, as organizações que implementam ou con-tribuem para essa causa podem esperar diversos benefícios.

Uma arquitetura bem projetada e bem ajustada da computação, armazenamento, funcionamento em rede e acesso de recursos em grande escala pode contribuir para facilitar o acesso do usuário final aos recursos de HPC, bem como tornar a manutenção e o suporte mais fáceis para a organização de TI.

INOVAÇÃO Os departamentos de TI de uma organização que podem se preparar para o acesso contínuo aos mais modernos equipamentos de sistemas acelerarão novas descobertas. Os pesquisadores podem se concentrar em sua pesquisa científica sem precisar se aprofundar em problemas de TI. Uma arquitetura bem projetada e bem ajustada da computação, armazenamento, funcionamento em rede e acesso de recursos em grande escala pode contribuir para facilitar o acesso do usuário final aos recursos de HPC, bem como tornar a manutenção e o suporte mais fáceis para a organização de TI.

LIDERANÇA Uma organização que utiliza melhor sua infraestrutura de TI de ponta atrai oportunidades adicionais de novas concessões e melhora sua capacidade em recrutar novos pesquisadores. Instalações de ponta, com os últimos sistemas de computação e armazenamento, permitem que os pesquisadores se concentrem em sua nova pesquisa com as ferramentas mais recentes. As organizações confiantes no uso da infraestrutura de TI moderna podem ajudar outras instituições, conforme necessário, ao fornecer consultoria sobre melhores práticas e auxiliar em oportunidades de pesquisa.

RESULTADOS DOS PACIENTES Uma organização que trabalha diretamente com pa-cientes pode demonstrar e quantificar melhor os resultados, não apenas ao ajudar os pacientes, mais também ao aumentar a visibilidade da organização. O uso das últimas técnicas em medicina personalizada leva a melhores resultados para os pacientes, o que, por sua vez, eleva o nível para todas as organizações concorrentes. Como a medicina de precisão permite o tratamento baseado em sintomas e diagnósticos in-dividuais, há menos probabilidade de um diagnóstico incorreto e mais opções para o tratamento de doen-ças raras. (O Center for Rare Childhood Diseases de-fine "raro" como menos de cinco em uma população de 10 mil pessoas.)

A tecnologia avançada permite que os médicos trabalhem com quantidades de dados maiores, criem modelos mais realistas e determinem melhores caminhos de tratamento para indivíduos. Isso também pode levar ao compartilhamento de informações e ideias com diversas organizações.

CAPACITAÇÃO Os pesquisadores normalmente são consumidores de toda a capacidade de armazenamento e capacidade de computação disponíveis. Quando há uma solução mais eficiente disponível para eles utilizarem, é possí-vel realizar simulações mais completas e simular mais resultados. Isso não permite apenas que decisões mais personalizadas sejam tomadas, mas capacita os especialistas em muitas áreas para desenvolver sua ciência. A tecnologia avançada permite que os mé-dicos trabalhem com quantidades de dados maiores, criem modelos mais realistas e determinem melhores caminhos de tratamento para indivíduos. Isso tam-bém pode levar ao compartilhamento de informações e ideias com diversas organizações.

3

Guia de genômica

Page 4: O guia do insideHPC de genômica - i.dell.comi.dell.com/sites/doccontent/shared-content/data-sheets/pt/... · Guia de genômica . Leia mais estudos de caso em | 508-259-8570 ... de

Leia mais estudos de caso em www.insidehpc.com | 508-259-8570 | [email protected]

Desafios

Há diversos desafios para a adoção mais ampla de tecnologias que podem impedir os fluxos de trabalho de medicina personalizada e a implementação de tais sistemas.

PERCEPÇÃO

Existe a percepção de que uma análise de genoma pode ser realizada apenas em centenas de nós ou em um supercomputador caro. No entanto, sistemas oti-mizados que incluem o hardware e o software corre-tos, projetados por especialistas de fornecedores líde-res, podem trazer a análise genômica para uma vasta base de pesquisadores e usuários. Em muitos casos, os departamentos de TI procuram por um ROI imedia-to ou rapidamente examinarão a utilização do cluster de computação/armazenamento. No entanto, é pos-sível começar com um tamanho pequeno e aumentar conforme as necessidades. O planejamento cuidado-so dessa expansão permite que servidores e armaze-namento sejam adicionados de forma incremental. Conforme os projetos se tornam mais complexos ou a quantidade de usuários aumenta, é possível adicionar servidores para aumentar a capacidade geral do clus-ter de computação e armazenamento.

Se uma solução pronta para uso estivesse disponível com o mínimo de experiência em TI necessária, os departamentos ou empresas menores poderiam aproveitar as tecnologias atuais e futuras.

ROI PARA CASOS DE USO PEQUE-NOS

Organizações pequenas que exigem recursos de TI sig-nificativos podem evitar atualizar sua infraestrutura para atender às necessidades dos usuários. Além da confusão quanto à escalabilidade de começar com um sistema pequeno e crescer conforme as necessidades, essas organizações podem não possuir a equipe para examinar diversas alternativas ou implementar um caminho de compra peça por peça. Elas podem estar resignadas a usar sua tecnologia antiga em vez de atu-alizar devido ao medo da TI desconhecida. No entan-to, se uma solução pronta para uso estivesse dispo-nível com o mínimo de experiência em TI necessária, os departamentos ou empresas menores poderiam aproveitar as tecnologias atuais e futuras.

CONFORMIDADE COM FDA E CLIA

A aprovação (conformidade) da FDA é necessária para dispositivos usados para tratar e diagnosticar as doen-ças do paciente. Os usos clínicos devem passar por um período de segurança. No entanto, a FDA possui várias regulamentações e garantias de segurança em vigor que devem ser seguidas ao trabalhar com a saúde do paciente, como certificações ao trabalhar com instru-mentos de laboratório, equipamentos e tecnologia que são usadas para facilitar a saúde do paciente. Esses controles de segurança podem ser desencorajadores, por isso a necessidade de trabalhar com equipes de serviço de fornecedor experientes.

SEGURANÇA

Os dados do paciente obviamente são muito valiosos e devem ser mantidos em segurança. A genômica não é exceção. Na verdade é ainda mais importante fornecer recursos e atenção quanto à segurança para os dados de prontuário do paciente. É necessário usar produtos, processos e ferramentas especiais para os dados do paciente e é necessário ser compatível com todas as exigências federais.

PRÁTICAS MÉDICAS

Os médicos que utilizam o arquivamento de imagem e prontuários médicos eletrônicos devem cumprir os procedimentos e protocolos para estar em conformi-dade com a Health Insurance Portability and Accoun-tability Act (HIPAA) e melhores práticas. Essas práticas incluem várias consultas com especialistas e peritos que podem ou não ser parte da infraestrutura de TI existente. Pelo fato de esses registros auxiliarem no tratamento ou diagnóstico, eles devem ser precisos e estar disponíveis rapidamente para as pessoas envolvi-das no tratamento de pacientes.

GERENCIAMENTO DE DADOS

É necessário gerenciar grandes blocos de dados em uma solução de genômica. Um único genoma possui apro-ximadamente de 200 GB a 300 GB. Embora os dados sejam compostos por apenas quatro letras (com TGAC como seus elementos fundamentais), há aproximada-mente 3 bilhões dessas bases de nucleotídeos em uma única pessoa. Os dados do sequenciador são um arquivo de dados muito grande que deve ser acessado, armaze-nado e segundo o qual se deve trabalhar. A análise de genoma amplia a necessidade de armazenamento pró-ximo, armazenamento transitório, armazenamento de arquivamento e largura de banda de rede.

4

Guia de genômica

Page 5: O guia do insideHPC de genômica - i.dell.comi.dell.com/sites/doccontent/shared-content/data-sheets/pt/... · Guia de genômica . Leia mais estudos de caso em | 508-259-8570 ... de

Leia mais estudos de caso em www.insidehpc.com | 508-259-8570 | [email protected]

Êxitos

NEUROBLASTOMA AND MEDULLOBLASTOMA TRANSLATIONAL RESEARCH CONSORTIUM (NMTRC) O NMTRC é um grupo de 18 universidades e hos-pitais infantis com sede no Helen DeVos Children's Hospital em Grand Rapids, Michigan. O grupo ofe-rece uma rede nacional de testes clínicos de câncer infantil. Esses testes são baseados na pesquisa de um grupo de pesquisadores cooperativos que estão ligados a programas de laboratório e que desenvol-vem terapias inovadoras para neuroblastomas e me-duloblastomas de alto risco.

"É uma abordagem baseada em equipe que inclui bioinformática, genômica, oncologia e farmacologia de uma maneira que realmente cumpre a promessa de melhores resultados nas vidas das crianças que participam de nossos estudos." – Giselle Sholler, MD MSC, presidente, NM-

TRC

"Ao trabalhar com parceiros como a Dell, TGen e NMTRC, estamos observando uma realidade total-mente nova nos cuidados com o paciente, a come-çar pelos testes clínicos", comenta Giselle Sholler, MD MSC, presidente, Neuroblastoma and Me-dulloblastoma Translational Research Consortium e diretora subsidiada na Haworth Innovative Thera-peutics Clinic no Helen DeVos Children's Hospital. "Neste novo modelo, a tecnologia da informação é a ponte que conecta todas as disciplinas clínicas para cuidados com o paciente realmente personali-zados. "É uma abordagem baseada em equipe que inclui bioinformática, genômica, oncologia e far-macologia de uma maneira que realmente cumpre a promessa de melhores resultados nas vidas das crianças que participam de nossos estudos."

Uma clínica de pesquisa líder estuda uma ampla va-riedade de áreas, inclusive engenharia biomédica, oncobiologia, medicina celular e molecular, medi-cina genômica, imunologia, cardiologia molecular, genética molecular, neurociência, pesquisa oftal-mológica, patologia, medicina regenerativa e biolo-gia de células-tronco e pesquisa oncológica.

Os resultados do uso do cluster Dell foram muito positivos. O tempo de execução inicial para uma análise de status de metilação foi reduzido de 20 para quatro horas. O cálculo da taxa de descobertas falsas foi reduzido de uma semana para 15 horas.

Esse instituto de pesquisa primeiro descobriu que era necessário o armazenamento além de um desktop comum e, assim, adicionou um sistema de armazena-mento de petabytes. A próxima etapa foi implemen-tar um sistema de computador que pudesse respon-der aos problemas computacionais mais exigentes. O cliente recorreu à Dell e à Intel® para fornecer uma solução que consistia nos últimos processadores Intel® Xeon® em servidores Dell PowerEdge™, que forneceram vários teraflops de desempenho com muitos terabytes de armazenamento de alto desem-penho. As ferramentas de software incluíram o Cen-tOS Linux, o Bright Cluster Manager®, a biblioteca OpenMPI, o GNU Compiler Collection (GCC), o Sim-ple Linux Utility for Resource Management (SLURM), o software Intel Solutions for Lustre® e o Intel Math Kernel Library (Intel MKL). Essa organização conse-guiu escalar sua infraestrutura e converter as neces-sidades clínicas em fluxos de trabalho acionáveis que ajudam os pacientes.

Os resultados do uso do cluster Dell foram muito po-sitivos. O tempo de execução inicial para uma análise de status de metilação foi reduzido de 20 para quatro horas. O cálculo da taxa de descobertas falsas foi re-duzido de uma semana para 15 horas. Agora, são re-alizadas várias execuções em uma semana, e não em meses. Há outros exemplos da redução dos tempos de execução de semanas ou dias para horas. Agora, é possível realizar várias execuções, o que gera os da-dos necessários para a correlação com tipos de cân-cer.

5

Guia de genômica

Page 6: O guia do insideHPC de genômica - i.dell.comi.dell.com/sites/doccontent/shared-content/data-sheets/pt/... · Guia de genômica . Leia mais estudos de caso em | 508-259-8570 ... de

Leia mais estudos de caso em www.insidehpc.com | 508-259-8570 | [email protected]

Além da análise genômica, outros domínios da ci-ência utilizam o cluster Dell para aprimorar sua própria pesquisa e os registros dos pacientes. Isso inclui o processamento de linguagem natural e notas do paciente em texto livre. Agora, as notas manuscritas dos médicos podem ser digitalizadas e convertidas em texto e anexadas ao prontuário mé-dico eletrônico. Técnicas normalmente associadas à mecânica estrutural, como a análise de elemen-tos finitos, estão sendo usadas no cluster Dell para realizar simulações de volume em ossos e simular a flexão passiva da articulação do joelho. Os tempos de execução foram reduzidos de 20 horas para uma hora e em 75% em outro caso. Milhares de simula-ções que não podiam ser executadas anteriormen-te agora podem.

TGEN O TGen ajuda a combater o câncer e outras doen-ças através do uso de genômica. O TGen percebeu que a velocidade e a precisão são fundamentais para a sobrevivência de um paciente. Para atingir essa velocidade, ele percebeu que precisava de computação de alto desempenho (HPC) para exe-cutar rapidamente algoritmos muito complexos. Havia terabytes de dados genéticos e moleculares disponíveis a partir dos bancos de dados de pesqui-sa e de pacientes. Os tratamentos personalizados são necessários com base no genoma e outras in-formações biológicas do paciente.

Para melhorar o tempo de resposta para análises genômicas e criar um plano de tratamento perso-nalizado, o TGen recorreu à Dell para implantar um cluster de HPC, o que permitiria acelerar o tempo para obter resultados. A solução Dell Genomic Data Analysis Platform (GDAP) consiste em servidores Dell PowerEdge com processadores Intel® Xeon®, storage arrays e software de gerenciamento.

O tempo é fundamental ao realizar o diagnóstico e criar um plano de tratamento personalizado. Com a Dell DGAP, o tempo necessário para o sequencia-mento genético foi reduzido consideravelmente, bem como os processos analíticos que facilitam o tratamento personalizado de sete dias para quatro horas.

"Não conheço nenhuma outra solução no mercado que seja como a Dell Genomic Data Analysis Pla-tform. Ela é otimizada para fluxos de trabalho genô-micos imediatamente e, dentro de alguns dias, você pode instalá-la, configurá-la e lançá-la na produção", comenta James Lowey, vice-presidente de tecnologia do Translational Genomics Research Institute. "Hoje, nós ajudamos a salvar mais vidas porque os pesqui-sadores gastam menos tempo aguardando recursos de HPC. E também é fácil para nós ajustar a escala e personalizar a nossa Dell Genomic Data Analysis Platform para oferecer suporte aos requisitos exclu-sivos."

Center For Rare Childhood Diseases (C4RCD)

O Center for Rare Childhood Disorders (C4RCD) do TGen utiliza os saltos tecno-lógicos mais recentes no sequenciamento de genoma para identificar as causas de doenças infantis raras que permanecem em grande parte um mistério para a me-dicina moderna.

"Com a plataforma Dell GDAP, o C4RCD consegue processar amostras genéticas rapidamente", comentou James Lowey, vice-presidente de tecnologia do TGen. "Isso é importante, uma vez que muitas das famílias dessas crianças estiveram em uma odisseia de diagnósticos, normal-mente passando anos sem uma resposta clara sobre o que está causando a condi-ção de seu filho. Ao aproveitar um sistema projetado para processar dados de NGS, os pesquisadores podem se concentrar na exploração e descoberta, e não na infraes-trutura de TI."

6

Guia de genômica

Page 7: O guia do insideHPC de genômica - i.dell.comi.dell.com/sites/doccontent/shared-content/data-sheets/pt/... · Guia de genômica . Leia mais estudos de caso em | 508-259-8570 ... de

Leia mais estudos de caso em www.insidehpc.com | 508-259-8570 | [email protected]

Solução Dell e Intel A Dell se uniu à Intel para criar soluções inovado-ras que podem acelerar a pesquisa, o diagnóstico e o tratamento de doenças através da medicina personalizada. A combinação dos processadores de ponta da Intel® e do conhecimento em sistemas e armazenamento da Dell criou uma solução de úl-tima geração fácil de instalar, gerenciar e expandir conforme necessário.

A Dell (fornecedora de sistemas) se uniu à Intel (fornecedora de CPU) para criar uma solução otimizada que aproveita as últimas tecnologias para fornecer um conjunto de tecnologias eficiente e fácil de usar. A solução foi projetada, testada quanto à referência de desempenho e empacotada para fornecer uma solução para diversos usuários.

Chamada de Dell Genomic Data Analysis Platform (GDAP), essa solução foi projetada para obter re-sultados rápidos com o máximo de eficiência. A solução foi projetada para resolver vários desafios dos clientes, inclusive a percepção de que a imple-mentação deve ser em larga escala por natureza, conformidade, segurança e usos clínicos.

•  Explosão de dados: um único genoma produ-zirá entre 200 GB e 300 GB de dados. Esses dados devem estar imediatamente disponíveis para os sistemas de computador que precisa-rão decodificá-lo. Os bancos de dados estão dobrando de tamanho a cada poucos meses.

•  Grandes requisitos de computação: com as grandes quantidades de dados chegando em um período de tempo tão pequeno, a expec-tativa é de que os resultados da análise com-putacional também cheguem em períodos de tempo menores.

•  Infraestrutura complexa: se um sistema for improvisado conforme as necessidades au-mentam, provavelmente haverá uma incom-patibilidade dos melhores componentes. Os

sistemas antigos precisarão ser conectados em rede com os sistemas mais novos e um aglome-rado de incompatibilidades de patches, armaze-namentos etc. certamente virá à tona. O depar-tamento de TI precisará, por fim, gerenciar essas incompatibilidades e lidar com a falta do desem-penho esperado do cluster. Em organizações me-nores que não possuem administradores espe-cializados em TI dedicados suficientes, o caos e a falta de confiança nos sistemas de computação certamente se tornarão um problema.

•  As ferramentas shareware, middleware e favo-ritas aparecerão na pilha de software. Um siste-ma definido precisará lidar com esses aplicativos específicos ou middleware.

A Dell (fornecedora de sistemas) se uniu à Intel (for-necedora de CPU) para criar uma solução otimizada que aproveita as últimas tecnologias para fornecer um conjunto de tecnologias eficiente e fácil de usar. A solução foi projetada, testada quanto à referência de desempenho e empacotada para fornecer uma solução para diversos usuários. Mais cenários de pa-cientes podem ser diagnosticados e tratados devido à seguinte seleção dos melhores componentes e tec-nologias do setor:

•  Processadores Intel® Xeon®, que se tornam mais potentes e econômicos em termos de consumo de energia a cada geração

•  Servidores HPC projetados pela Dell para forne-cer computação rápida a um consumo menor de energia

•  Hardware de armazenamento da Dell combinado com os principais softwares para taxa de transferência e recuperação de dados máximas

•  Software padronizado, testado e ajustado para o hardware selecionado

•  Serviços Dell para trabalhar com os cientistas e médicos para implementar e manter a solução conforme necessário ou atuar como consultores

7

Guia de genômica

Page 8: O guia do insideHPC de genômica - i.dell.comi.dell.com/sites/doccontent/shared-content/data-sheets/pt/... · Guia de genômica . Leia mais estudos de caso em | 508-259-8570 ... de

Leia mais estudos de caso em www.insidehpc.com | 508-259-8570 | [email protected]

Dell GDAP

A Dell GDAP é uma infraestrutura de processamento genômico integrada e completa� Ela foi projetada para atender às necessidades dos pesquisadores e médicos e inclui todos os componentes necessários para reduzir o tempo de resposta de dias para horas� É possível encontrar um relatório detalhado da solução na referência 1�

Chassi A solução usa um rack Netshelter AR3300 Dell PowerEdge APC, que inclui processadores Intel® Xeon®, selecionados por sua facilidade de mon-tagem de unidade de distribuição de energia e gerenciamento de cabos simples.

Nós de login A solução inclui quatro servidores Dell PowerE-dge R420 com processadores Intel® Xeon® que estão na solução como nós de login para o moni-toramento e envio de trabalho ou nós principais para executar o Bright Cluster Manager® para implantar, provisionar e monitorar os servidores.

Nó de memória fat O Dell PowerEdge R820 com processadores In-tel® Xeon® foi incluído para determinados apli-cativos que exigem uma quantidade de memória significativa. Esse nó alto de 2U e quatro soque-tes possui uma largura da banda de memória significativa e está disponível para os aplicativos memoryintensive de modo.

Nós de computação Os nós computacionais são os blades Dell PowerEdge M420 com processadores Intel® Xeon®, alojados em um chassi Dell PowerEdge M1000e. Os blades PowerEdge M420 são os únicos blades de um quarto de altura no mercado e foram seleciona-dos pelo desempenho por watt e desempenho por U. (1U = 1,75 polegadas de altura.)

Armazenamento O componente de armazenamento contém o seguinte:

•  Solução de alta disponibilidade NFS com capacidade bruta de até 180 TB

•  Solução de armazenamento de alto de-sempenho (HSS) Dell Terascala baseada em Lustre com até 360 TB disponíveis em um único namespace

•  Dell PowerEdge R320 como o gateway de CIFS

Funcionamento em rede Há duas opções disponíveis, uma com um com-ponente Ethernet de 10 Gbit e outra com um componente FDR InfiniBand®. Com a versão InfiniBand, somente FDR10 tem suporte com os blades Dell PowerEdge M420 em um modo sem bloqueio e em uma conectividade FDR10 de bloqueio 2:1 com o switch de topo de rack (top-of-rack).

Software Os seguintes componentes de software estão contidos no Dell GDAP:

•  Bright Cluster Manager para o provisiona-mento, monitoramento e gerenciamento do cluster Dell. Dois servidores Dell PowerEdge R420 são implantados como os nós princi-pais para executar o Bright Cluster Manager.

•  Intel Cluster Studio para o desenvolvimento de aplicativos. Os componentes incluem:

– C++ Composer XE – Fortran Composer XE – Math Kernel Library (MKL) – Integrated Performance Primitives (IPP) – Threading Building Blocks – MPI Benchmarks – Trace Analyzer and Collector – Debugger

Personalizações A solução Dell pode ser modificada a partir da lista de componentes da linha de base para atender às diversas cargas de trabalho.

Benefícios da solução Dell A Dell GDAP pode proporcionar diversos bene-fícios às pessoas que executam aplicativos de genômica:

• Alta disponibilidade • Tempo para obtenção de ideias aprimorado • Escalabilidade • Economia no consumo de energia • Modelo plug-and-play

8

Guia de genômica

Page 9: O guia do insideHPC de genômica - i.dell.comi.dell.com/sites/doccontent/shared-content/data-sheets/pt/... · Guia de genômica . Leia mais estudos de caso em | 508-259-8570 ... de

Leia mais estudos de caso em www.insidehpc.com | 508-259-8570 | [email protected]

A Dell GDAP foi projetada para ser flexível, mas com componentes otimizados. Foram executa-das referências de desempenho que demonstram todas as fases do fluxo de trabalho de análise de genoma com os excelentes resultados de ser ca-

Switch IB Mellanox SX6036

Nó de gerenciamento HSS 6.0 Dell PowerEdge R320 com

processadores Intel® Xeon® 2x Nós de login Dell PowerEdge R420 BCM

Nó fat Dell PowerEdge R820 com processadores Intel® Xeon®

com 1,5 TB de memória

Armazenamento de HA NSS 6.0 Dell PowerVault MD3460

Destino de armazenamento de metadados HSS 6.0 Lustre Dell

PowerVault MD3420

Destino de armazenamento de objetos HSS 6.0

Dell PowerVault MD3460

Chassi do Dell PowerEdge M1000e com processadores Intel® Xeon®

com 32 Dell PowerEdge M420s

Referências 1) Dell Genomic Data Analysis Platform:

http://i.dell.com/sites/doccontent/business/ solutions/brochures/en/Documents/BrochureGenomic-Data-Analysis-Platform.pdf

2) TGEN: http://www.dell.com/learn/us/en/vn/ corporate~case-studies~en/documents~2014t-gen-10013443-scalable-hpc-data-ceterconsul-ting.pdf

3) TGEN: http://i.dell.com/sites/doccontent/ corporate/case-studies/en/Documents/ 2014- tgen-10013443-scalable-hpc-data- ceter-con-sulting.pdf

4) NMRTC: http://onlinelibrary.wiley.com/ doi/ 10.1002/cam4.436/pdf

5) NMRTC: http://beatnb.org/about/our-mission/

paz de analisar até 37 genomas por dia. Além disso, a energia usada ao longo do tempo foi monitorada e de-monstrou uma excelente relação entre desempenho/energia, expressa em kWh.

Gateway CIFS Dell PowerEdge R320 de switch Force10 S55 com processadores Intel® Xeon®

2x Nós principais Dell PowerEdge R420 BCM com processadores Intel® Xeon®

2x Nós principais de HA NSS 6.0 Dell PowerEdge R630 com processadores Intel® Xeon®

2x Servidores de metadados Lustre HSS 6.0 Dell PowerEdge R630 com processadores Intel® Xeon®

2x Servidores de armazenamento de objetos Lustre HSS 6.0 Dell PowerEdge R630 com processadores Intel® Xeon®

Destino de armazenamento de objetos HSS 6.0 Dell PowerVault MD3460

Sobre o autor: Michael A. Schulman Michael é um escritor e profissional de marketing ex-periente em computação de alto desempenho. Ele possui interesses nas áreas de como as tecnologias de HPC podem ser usadas para produzir novas ideias em vários domínios técnicos, bem como em novas tecno-logias de HPC que tornam o acesso mais fácil. Sua ex-periência inclui trabalhar na Silicon Graphics, Inc., Sun Microsystems e em outras organizações de HPC. É for-mado e tem mestrado pela Cornell University. Michael é o editor de recursos do insideHPC.

Intel, o logotipo da Intel, Xeon e Xeon Inside são marcas co-merciais ou registradas da Intel Corporation nos Estados Unidos e/ou em outros países�

9

Guia de genômica