Juan David Pineda-Caacuterdenasltjpineda2eafiteducogt
Ciclo de ConferenciasCentro de Computacioacuten Cientiacutefica APOLO
Universidad EAFIT
Optimizando su coacutedigo serial y paralelo con algunas de las herramientas de desarrollo de Intel
Tomado de httpsnewsroomintelcomeditorialsadvancing-security-silicon-level
Avance de la seguridad a nivel del silicio
ldquoToday I want to provide several updates that show continued progress to fulfill that pledge First we have now released microcode updates for 100 percent of Intel products launched in the past five years that require protection against the side-channel method vulnerabilities discovered by Google As part of this I want to recognize and express my appreciation to all of the industry partners who worked closely with us to develop and test these updates and make sure they were ready for productionrdquo
By Brian Krzanich - CEO Intel Corp
Avance de la seguridad a nivel del silicio
ldquoWhile Variant 1 will continue to be addressed via software mitigations we are making changes to our hardware design to further address the other two We have redesigned parts of the processor to introduce new levels of protection through partitioning that will protect against both Variants 2 and 3 Think of this partitioning as additional ldquoprotective wallsrdquo between applications and user privilege levels to create an obstacle for bad actorsrdquo
By Brian Krzanich - CEO Intel Corp
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Capas de Programacioacuten Paralela
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Paralelismo Nuacutecleos y vectores
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Plataformas de Coacutemputo de Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon
1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda
(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon Phi (2a Generacioacuten)
Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda
(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de httpsnewsroomintelcomeditorialsadvancing-security-silicon-level
Avance de la seguridad a nivel del silicio
ldquoToday I want to provide several updates that show continued progress to fulfill that pledge First we have now released microcode updates for 100 percent of Intel products launched in the past five years that require protection against the side-channel method vulnerabilities discovered by Google As part of this I want to recognize and express my appreciation to all of the industry partners who worked closely with us to develop and test these updates and make sure they were ready for productionrdquo
By Brian Krzanich - CEO Intel Corp
Avance de la seguridad a nivel del silicio
ldquoWhile Variant 1 will continue to be addressed via software mitigations we are making changes to our hardware design to further address the other two We have redesigned parts of the processor to introduce new levels of protection through partitioning that will protect against both Variants 2 and 3 Think of this partitioning as additional ldquoprotective wallsrdquo between applications and user privilege levels to create an obstacle for bad actorsrdquo
By Brian Krzanich - CEO Intel Corp
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Capas de Programacioacuten Paralela
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Paralelismo Nuacutecleos y vectores
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Plataformas de Coacutemputo de Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon
1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda
(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon Phi (2a Generacioacuten)
Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda
(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Avance de la seguridad a nivel del silicio
ldquoToday I want to provide several updates that show continued progress to fulfill that pledge First we have now released microcode updates for 100 percent of Intel products launched in the past five years that require protection against the side-channel method vulnerabilities discovered by Google As part of this I want to recognize and express my appreciation to all of the industry partners who worked closely with us to develop and test these updates and make sure they were ready for productionrdquo
By Brian Krzanich - CEO Intel Corp
Avance de la seguridad a nivel del silicio
ldquoWhile Variant 1 will continue to be addressed via software mitigations we are making changes to our hardware design to further address the other two We have redesigned parts of the processor to introduce new levels of protection through partitioning that will protect against both Variants 2 and 3 Think of this partitioning as additional ldquoprotective wallsrdquo between applications and user privilege levels to create an obstacle for bad actorsrdquo
By Brian Krzanich - CEO Intel Corp
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Capas de Programacioacuten Paralela
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Paralelismo Nuacutecleos y vectores
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Plataformas de Coacutemputo de Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon
1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda
(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon Phi (2a Generacioacuten)
Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda
(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Avance de la seguridad a nivel del silicio
ldquoWhile Variant 1 will continue to be addressed via software mitigations we are making changes to our hardware design to further address the other two We have redesigned parts of the processor to introduce new levels of protection through partitioning that will protect against both Variants 2 and 3 Think of this partitioning as additional ldquoprotective wallsrdquo between applications and user privilege levels to create an obstacle for bad actorsrdquo
By Brian Krzanich - CEO Intel Corp
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Capas de Programacioacuten Paralela
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Paralelismo Nuacutecleos y vectores
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Plataformas de Coacutemputo de Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon
1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda
(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon Phi (2a Generacioacuten)
Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda
(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Capas de Programacioacuten Paralela
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Paralelismo Nuacutecleos y vectores
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Plataformas de Coacutemputo de Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon
1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda
(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon Phi (2a Generacioacuten)
Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda
(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Capas de Programacioacuten Paralela
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Paralelismo Nuacutecleos y vectores
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Plataformas de Coacutemputo de Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon
1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda
(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon Phi (2a Generacioacuten)
Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda
(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture Colfax Research Intel Coursera httpsescourseraorglearnparallelism-ia
Capas de Programacioacuten Paralela
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Paralelismo Nuacutecleos y vectores
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Plataformas de Coacutemputo de Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon
1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda
(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon Phi (2a Generacioacuten)
Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda
(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Paralelismo Nuacutecleos y vectores
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Plataformas de Coacutemputo de Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon
1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda
(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon Phi (2a Generacioacuten)
Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda
(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Plataformas de Coacutemputo de Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon
1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda
(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon Phi (2a Generacioacuten)
Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda
(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon
1- 2- 4 CPUs por Servidor Propoacutesito General Altamente Paralelos (44 nuacutecleos) Rico en recursos (+ cores + cache) ldquoForgiving Performancerdquo ~ 10 TFLOPs en DP (Teoacuterico) ~ 154 GBs de ancho de banda
(Medido)2-way Intel Xeon Broadwell architecture (2016) top of the line (eg E5-2699 V4)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon Phi (2a Generacioacuten)
Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda
(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel Xeon Phi (2a Generacioacuten)
Booteable PCIe add-in card Especializado para HPC Altamente paralelo (72 nuacutecleos) Balanceado para coacutemputo ldquoLess forgiving than Xeonrdquo ~ 30 TFLOPs en DP (Teoacuterico) ~ 490 GBs de ancho de banda
(Medido) Intel Xeon Phi Knights Landing architecture (2016) top of the line (eg 7290P)
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Un coacutedigo para todas las plataformas
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Computacioacuten en Ciencia e Ingenieriacutea
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Aacutereas de Optimizacioacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Experiencia en Modernizacioacuten de Coacutedigo Comuacuten
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Multihilos con OpenMP
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Vectorizacioacuten con Compiladores Intel
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Traacutefico de memoria
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Clusters y MPI
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Fundamentals of Parallelism on Intel Architecture httpsescourseraorglearnparallelism-ia
Intel en Apolo
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones generales para optimizacioacuten -O1
Optimizar tamantildeo del coacutedigo no vectorizacioacuten -O2 - Por defecto
Inlining vectorizacioacuten Optimizaciones baacutesicas de ciclos
-O3 Aplicaciones intensivas en ciclos Incluye todas las de O2 Transformaciones de ciclos maacutes agresiva
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Optimizacioacuten para Multi-Nuacutecleo y Multi-procesamiento -parallel
Optimizacioacuten Auto-paralelismo Lenguajes soportados para paralelismo expliacutecito
OpenMP 40 y la mayor parte de 45 Disponible para CC++ y Fortran Paralelismo basado en PragmasDirectivas Reducciones
-xHost Le dice al compilador que genere instrucciones para el
conjunto de instrucciones maacutes alto que esteacute disponible
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -mlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones puede generar seguacuten lttargetgt Targets
SSE SSE2 (default) SSE3 SSSE3 SSE41 SSE42 AVX AVX2 AVX512 IA32
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Tomado de Optimization for Intel C++ and Fortran Compilers httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction
Opciones especiacuteficas por procesador -xlttargetgt
Le dice al compilador cuales caracteriacutesticas puede usar incluyendo cuaacutel conjunto de instrucciones y optimizaciones puede generar seguacuten lttargetgt Targets
COMMON-AVX512 MIC-AVX512 CORE-AVX512 CORE-AVX2 CORE-AVX-I AVX SSE42 SSE41 ATOM_SSE42 ATOM_SSSE42 ATOM_SSSE3
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Math Kernel Library
Acelera rutinas matemaacuteticas incrementa el rendimiento de las aplicaciones y reduce el tiempo de desarrollo
Libreriacutea lista para usar que incluye Algebra Lineal Transformadas raacutepidas de Fourier Redes neuronales profundas Estadiacutestica vectorial y ajuste de datos Matemaacutetica vectorial
Usa la API de C y Fortran para Compatibilidad con BLAS LAPACK y FFTW No se requieren cambios de coacutedigo
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
iquestDoacutende Obtenerlo
bull httpssoftwareintelcomen-usqualify-for-free-softwarestudentbull httpssoftwareintelcomen-usqualify-for-free-softwareeducator
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Recurso Introduccioacuten a OpenMP
httpsyoutubenE-xN4Bf8XI
bull
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Python Intel Distribution
httpssoftwareintelcomen-usdistribution-for-python
bull
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
httpcourseraorglearnparallelism-ia
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Compiler options httpssoftwareintelcomen-usnode677967 Math Kernel Library httpssoftwareintelcomen-usmkl Fundamentals of Parallelism on Intel Architecture
httpswwwcourseraorglearnparallelism-iahomewelcome Intel Software Development Products Samples and Tutorials
httpssoftwareintelcomen-usproduct-code-samplesfield_software_product_tid[]=20813 Performance essentials using OpenMP 40 vectorization with CC++
httpssoftwareintelcomen-usvideosperformance-essentials-using-openmp-40-vectorization
Vectorization Essentials httpssoftwareintelcomen-usarticlesvectorization-essential Intel C++ Compiler Introduction
httpssoftwareintelcomen-usarticlesintel-c-compiler-introduction Tutorial Using Auto Vectorization
httpssoftwareintelcomen-usintel-cplusplus-compiler-auto-vectorization-tutorial Explor our documentation
httpssoftwareintelcomen-usdocumentationfield_software_product_tid5B05D=20813ampfield_software_product_tid5B15D=20813ampfield_article_type_tid5B05D=20783ampfield_article_type_tid5B15D=20783
Intel C++ Compiler in Intel Parallel Studio XE Support httpssoftwareintelcomen-usc-compilersipsxe-supporttraining
Referencias y Recursos
Top Related