Post on 15-Jan-2016
description
Metody molekulární biologie v ekologii a systematice rostlin
3. Populační genetika (s.l.)
Petr Koutecký & Jiří Košnar, 2013
Vytvořeno v rámci projektu Molekularizace biologických
oborů PřF JU
reg. č. CZ.1.07/2.2.00/15.0364
Populace
► Definic více, žádná ideální
► Pokus o praktickou definici:
Soubor jedinců daného taxonu (druhu, skupiny,…), žijících na určitém místě, mezi kterými alespoň teoreticky může docházet k výměně genetické informace při rozmnožování (resp. nejsou zde žádné zjevné bariéry)
Populace
Specifika rostlin
► vegetativní (klonální) rozmnožování» v extrémním případě celá populace = jeden jedinec» dlouhodobá (potenciálně nekonečná) existence genotypu
► přisedlé organismy, při rozmnožování (resp. cizosprášení) závislé na vnějších činitelích » hmyz, vítr, voda,…» roznos pylu největší v blízkém okolí, se vzdáleností klesá» totéž platí pro roznos semen» za určitou vzdáleností je příspěvek daného jedince (resp. šance
účastnit se rozmnožování) minimální i ve zcela stejnorodé populaci bez zjevných bariér
» isolation by distance
Lokus, alela, atd.
Lokus► konkrétní pozice v genomu (dané místo na chromosomu, konkrétní
sekvence,…); v praxi také konkrétní pozice na gelu
Gen► funkční sekvence DNA (kódující protein, RNA,…)► někdy pojem používán šířeji, ve smyslu lokus
Alela► varianta sekvence v daném lokusu; zprostředkovaně varianta s
jinou velikostí, mobilitou na gelu, morfologickým projevem,…► dominantní data – dvě alely, nelze poznat heterozygoty;
kodominantní data – 2 nebo víc alel, lze odlišit heterozygoty
Genotyp► soubor alel daného jedince (jedno- vs. multilokusový)
Lokus, alela - dominantní data
► Lokus = daná pozice (= délka fragmentu) na gelu
► typicky bialelická data ve formátu 0 / 1» přítomnost / nepřítomnost proužku na gelu» nelze rozlišit heterozygoty pro recesivní
alelu
AA fragment přítomen 1
Aa fragment přítomen 1
aa bez projevu (fragment 0nepřítomen)
► výsledek „fingerprintingových“ metod» RAPD, ISSR, AFLP» u složitějších pattern lze takto redukovat i kodominantní data
(mikrosatelity, isozymy)
Popis variability populace / jedince
► Počet alel (A)» pro každý lokus, průměr přes všechny lokusy (kodom. data)
► Allelic richnes» průměrný počet alel korigovaný na počet vzorků / populací
(bootstrap apod.) (kodominatní data)
► Podíl polymorfních lokusů (P)» podíl = počet polymorních / počet všech
» někdy počítán lokus jako polymorfní jen pokud je frekvence nejčastější alely <95%, resp. f(1) < 95% (dominatní data)
» fixované alely / lokusy f > 95%, vzácné alely / lokusy f < 5% (u kodominatních dat mluvíme o alelách, u dominantních přímo o lokusech, tj. stav = 1 = přítomnost)
Popis variability populace / jedince
► Privátní (diagnostické) alely / lokusy» přítomné pouze v dané skupině (populaci, taxonu,…)
» nemusí být u všech jedinců
► Fixované alely / lokusy» přítomné u všech jedinců dané skupiny
► Privátní fixované alely / lokusy» přítomné pouze u dané skupiny, a to u všech jedinců
• ideální rozlišovací „znak“
► Sdílené alely / lokusy
» společné s jinou skupinou / skupinami
Popis variability populace / jedince
► Shanonův index» diverzitní index, podobně jako v ekologii
pi = frekvence alely i; pro 1 lokus
» u kodominantních dat počítáno pro jednotlivé lokusy, následně průměr přes všechny lokusy
» u dominantních dat je i frekvence dominantní „alely“, suma přes všechny lokusy
ii
iSHppH ln*
Klonalita v populaci► Clonal diversity
G / N kde G je počet genotypů, N počet jedinců
R = (G – 1) / (N – 1) pro 1 klon pak vyjde 0
► Simpsonův index
» λ je pravděpodobnost, že 2 ramety budou mít stejný genotyp
» D = 0 pro uniformní populaci; D = 1 pokud každá rameta je jiný genotyp
► Statistika Pgen (Psex)
» pro klony, udává pravděpodobnost, že daný genotyp vznikl opakovaně pohlavním rozmnožováním
» počítáno z frekvencí alel a polymorfních lokusů a počtu vzorků
)1()1(
NNnn ii
)1()1(
1NNnn
D ii ni počet ramet daného genotypuN celkový počet ramet
Parks & Werth 1993, Am. J. Bot.Arnaoud-Haound et al. 2005, J. Heredity
Heterozygosita
Pozorovaná heterozygozita► nemá smysl pro dominantní data► pro jeden lokus
i, j = alely, N = počet jedinců
► pro více lokusů
j,iNN
Hij
o
N
i
m
jij o H
NmH
1 1
1N počet jedincům počet lokusůHij heterozygotnost jedince i
(0 nebo 1) pro lokus j
Hardy-Weinbergova rovnováha► užitečný nulový model
» při nekonečné populaci, náhodném páření, absenci selekce, migrace,… … závisí frekvence genotypů přímona frekvencích alel
► pro diploidy a dvě alely A, a, které mají frekvence p, q
frekv. (AA) = p2 frekv. (Aa) = 2pq frekv. (aa) = q2
p + q = 1 p2 + 2pq + q2 = 1
» a to při libovolné frekvenci alel
» tato rovnováha se vytvoří po jednégeneraci náhodného páření (atd.)
» v dalších generacích je stabilní
♂ pq♀
p
q
p2pq
p q q2
Hardy-Weinbergova rovnováha
► evoluce = změny ve frekvenci alel
► odchylky od HW rovnováhy» selekce → tu se ale většinou „snažíme“ nevidět (selekčně neutrální
markery)» genetický drift» migrace» mutace (vznik nových alel)
Genetický drift
► proces náhodných změn frekvence alel v populaci
► způsoben konečnou velikostí populace – Wright-Fisherův model» populace produkuje ∞ gamet» do další generace projde ale jen 2N
gamet (N = velikost populace)» frekvence alel v náhodném výběru 2N
gamet nemusí být stejné jako výchozífrekvence (sampling error)
» zastoupení alel mezi generacemi se náhodně mění
» časem fixace nebo ztráta alely → snížení diverzity a heterozygozity
» intenzita závisí na velikost populace
Efektivní velikost populace
► velikost ideální populace (náhodné páření atd.), která jeví stejnou intenzitu gen. driftu jako reálná populace» většinou platí Ne ≤ N
» Ne lze chápat jako počet jedinců, kteří svými gametami přispějí ke vzniku další generace (= ne všichni)
► typické příčiny snížené Ne
» nenáhodné páření (včetně isolation by distance)
» fluktuace velikosti populace
» nevyrovnaný poměr pohlaví (typicky u živočichů, u rostlin má smysl uvažovat u dvoudomých druhů)
Očekávaná heterozygozita = gene diversity (D)► předpoklad: populace v Hardy-Weinbergově rovnováze
» lze počítat i pro dominantní data
► pro jeden lokus
resp.
► pro více lokusů;
Heterozygosita
k
iie pH
1
21
k
iie p
NN
H1
2112
2
pravděpodobnost, že jedinec je pro danou alelu homozygot = frekvence homozygotů pro alelu
korekce na malé vzorky (N < 50)
m
l
k
iie p
mH
1 1
211
p frekvence alelyi,k i-tá alela z k alel v
lokusul,m lokus l z celkem m
lokusůN počet jedinců
► obvykle 3 úrovně variability» celková populace (celý druh)
» rozdíly mezi subpopulacemi (= dílčími populacemi)
» individuální variabilita uvnitř subpopulací
» lze zavést i další (region sdružující část subpopulací)
► většinou se uvažují pouze diploidi» pro vyšší ploidie nejsou výpočty obvykle k dispozici
» nemá smysl srovnávat variabilitu (počet alel, polymorfní lokusy, heterozygosita,…) mezi ploidiemi
Fixační indexy
Fixační indexy (F-statistika)
► inbreeding
► diferenciace do subpopulací (drift)
► celkový
S
ISIS
HHH
F
T
STST
HHH
F
T
ITIT
HHH
F
HI pozorovaná heterozygozita uvnitř subpopulace = Ho
HS očekávaná heterozygozita uvnitř subpopulace (z frekvencí alel v subspopulaci) = He
HT očekávaná heterozygozita v celkové populaci (z průměrných frekvencí alel přes všechny subpopulace)
► při HW rovnováze všechny koeficienty = 0, lze statisticky testovat
(1 - FIT) = (1 – FIS) * (1 - FST)
► měří rozdíl heterozygotnosti oproti HW rovnováze
FIS měří úbytek heterozygotů uvnitř subpopulace vlivem inbreedingu (příbuzenského křížení)
… případně dalších odchylky (přebytek heterozygotů vlivem pozitivní selekce apod.)
► rozsah hodnot <-1; 1>
-1 pouze heterozygoti
0 HW rovnováha
+1 pouze homozygoti
► pro jednotlivé subpopulace; vážený průměr přes subspopulace
Fixační indexy
S
ISIS
HHH
F
e
oeIS
HHH
F
FST měří vliv diferenciace na subpopulace
» rozdělení na subpopulace → drift → postupná fixace alel (ztráta heterozygotnosti) v subpopulacích, ačkoliv průměrné celkové frekvence alel jsou stabilní
GST coefficient of gene differentiation, zobecnění FST (FST původně definováno pro bialelický lokus, GST pro multialelický)
► rozsah hodnot <0; 1>, stupeň diferenciace:< 0.05 malá 0.15-0.25 velká0.05-0.15 střední > 0.25 velmi velká
Fixační indexy
T
STST
HHH
G HSprůměrná očekávaná
heterozygozita (He) uvnitř subpopulací
HT , kde je průměr přes všechny
subpopulace
21 ip ip
Fixační indexy
► FST / GST je mírou diferenciace subpopulací:
žádná diferenciace velká diferenciace
► závisí na (vnitropopulační) variabilitě lokusu» nebere v úvahu identitu alel, není to distance
» pozor na příliš variabilní lokusy !
T
STST
HHH
G
SST HG 1
HS = 0, GST = 1 HS ~1, GST ~ 0
► hodnoty FST závisí v reálných populacích také na migraci mezi subpopulacemi, rychlosti mutací,…» obvykle složitější vzorce
• island model, stepping stone model, isolation by distance
» specializovaný software
» existují odhady (modely) F-statistiky i pro dominatní data (např. program Hickory)
• moc to nefunguje
► hodnoty různým způsobem vypočtených koeficientů nejsou zcela srovnatelné
► pairwise FST – matice koeficientů pro každý pár subpopulací
» je mírou genetické vzdálenosti (distance)
Fixační indexy
AMOVA
► Analysis of Molecular Variance► metoda pro studium populační struktury► rozdělení variability na složky mezi jedinci, populacemi, skupinami
populací,… (analogie ANOVA)» matice vzdáleností (nepodobností) mezi jedinci, různé vzorce podle
charakteru dat (kodominantní, dominantní, sekvence…)» a priori definovaná populační struktura (populace, skupiny populací
(regiony), příp. další úrovně)» výpočet variability (sum of squared deviations) pro jednotlivé úrovně,
přepočet na podíl na celkové variabilitě (variance components) se zohledněním d.f.
» výpočet ΦST (AMOVA-based FST) srovnáním složek variability jednotlivých úrovní
» permutační testy
AMOVA
► program Arlequin
rozdělení variability na jednotlivé složky
fixační indexy (ΦST)
permutační testy
mezi populacemi celkemmezi populacemi ve skupině
mezi skupinami
Linkage disequilibrium
► nenáhodná segregace alel 2 různých lokusů
► některé kombinace častější / méně časté než při náhodném párování» výskyt na stejném chromosomu, obvykle blízko sebe (mezi
lokusy ± nedochází k rekombinaci)
» selekce ve prospěch určitých kombinací
» allopolyploidie
Linkage disequilibrium
► Pro 2 lokusy s 2 alelami:
lokus 2lokus 1 A2 B2alela frekv. q1 q2
A1 p1 x11 x12
p1q1 p1q2
B1 p2 x21 x22
p2q1 p2q2
D = x11x22 – x12x21
Při rovnováze (není linkage) D = 0
Při náhodném párování
Různé typy dat
► většina klasické populační genetiky má smysl pouze pro kodominantní data
► pro dominantní data obecně nemají smysl žádné indexy založené na heterozygozitě (klasické FIS, FST,…)
► všechny hodnoty mají smysl pouze pro konkrétní studii, konkrétní výsledky (dataset), nelze moc srovnávat
► nemá smysl srovnávat hodnoty (byť ze stejných jedinců) založené na různých metodách
► nemá smysl porovnávat mezi plodiemi» jiný počet kopií genu v jedinci (= jiná Ne), zásadně jiná dynamika
genetického driftu,…
Coalescence
► Pohled zpět v čase» V populaci existuje v každém
okamžiku určitá sada alel
» Zastoupení alel se mění (vznikmutacemi; zánik; různá úspěšnostpři přechodu do další generace)
» pro každou dvojici alel v danégeneraci někde MRCA – most recent common ancestor)
1 – pro fialovou a tmavomodrou
2 – pro fialovou, tmavomodrou ačervenou
1
2
t1
t2
Coalescence► původ recentních alel lze zobrazit jako strom
» délka větví odpovídá stáří koalescenční události
► coalsecence-based FST
► koalescenční přístup pro konstrukci fylogenetických stromů» viz později
t1
t2
T
STST
t
ttF
tT – průměrný čas k MRCA (přes všechny dvojice alele) v celkové populaci
tS – totéž pro subpopulaci
Distance – kodominatní data
► Standard genetic distance (Nei)» identita
» distance
n
iiy
n
iix
n
iiyix
pp
ppI
1
2
1
2
1x,y populacepi frekvence alely i z n alel
pravděpodobnost, že 2 náhodně vybrané alely z populací x,y budou stejné
pravděpodobnost, že 2 náhodně vybrané alely z populace x, resp. y budou stejné
)ln(ID 12
12 2
x
ixx
NpNkorekce na malý počet vzorků,
analogicky pro populaci yunbiased distance
Distance – kodominantní data
► Roger’s distance
m
j
n
iiyixR pp
md
1 1
2)(211
x,y populacepi frekvence alely i z n alel v lokusu jm počet lokusů
Distance – dominantní data► většinou koeficienty neuvažující negativní shodu
» vyšší pravděpodobnost nehomologie v případě absence PCR produktu (proužku)
► Jaccardův koeficient
(podobnost) (distance)
► Dice coefficient (= Nei-Li coefficient)
(podobnost) (distance)
► negativní shoda výjimečně (simple matching, percent similarity; a+d / a+b+c+d)
počet lokusů, kde:jedinec 2
prezence (1) absence (0)
jedinec 1
prezence (1) a babsence (0) c d
cbaa
J
cb2a2a
D
J1cba
cbJ'
D1D'
Distance
► výsledkem je matice vzdáleností
» analýza hlavních koordinát, PCoA (principal coordinate analysis) = MDS (metric multidimensional scaling)
» shluková analýza (cluster analysis)• zejména metoda UPGMA
» neighbour-joining (NJ), resp. neighbour-networks
PCoA
► ordinační metoda► zobrazení objektů v ordinačním prostoru:
» prvních několik os vysvětluje nejvíce variability
» Euklidovské vzdálenosti mezi objekty aproximací vzdáleností v původní matici
» podobná PCA, ale pro jakékoliv distance
(pro euklidovské distance řešení identické s PCA)
Mandáková & Münzbergová 2008Aster amellus, allozymy, diploidi a
hexaploidi
Ramaya et al. 2010, Frullania asagrayana, SSR
Shluková analýza
► obvykle algoritmus UPGMA (unweighted pair-group method using arithmetic averages)» spojení dvou nejpodobnějších objektů v matici
» výpočet nové matice s n-1 objekty, skupina jako 1 objekt, počítána průměrná distance k jeho členům
» spojení dvou nejpodobnějších objektů
» nová matice
» …
» dendrogram
Kaplan & Štěpánek 2003Potamogeton pusillusallozymy
Neighbour-joining
► fenetická metoda (znaky mají stejnou váhu), podobně jako UPGMA
► nejčastější metoda na genetické distance
► na rozdíl od shlukovacích metod nespojuje nejpodobnější objekty, ale hledá nejkratší strom, délka stromu je počítána z matice distancí
Neighbour-joining
1. matice distancí
2. hvězdicovitý stromA
B
C
D
E
Neighbour-joining
1. matice distancí
2. hvězdicovitý strom
3. pro každou dvojici bodů výpočet délky stromu za předpokladu, že tyto dva body budou vybrány jako nejbližší
» vložení dvou hypotetických uzlů• pro testovanou dvojici• pro zbytek
A
B
C
D
EA
B
C
D
E
atd.
Neighbour-joining
1. matice distancí
2. hvězdicovitý strom
3. pro každou dvojici bodů výpočet délky stromu za předpokladu, že tyto dva body budou vybrány jako nejbližší
4. vybrána ta dvojice, pro kterou vyjde nejnižší hodnota celkové délky
» nemusí to být nejbližší body
5. výpočet délky větví k vybraným bodům a nové výchozí délky stromu
D
A
B
C
E
Neighbour-joining
6. testování zbylých bodůC
A
B
D
EA
B
C
ED
A
B
C
D
E
Neighbour-joining
6. testování dvojic zbylých bodů
7. připojení nejbližšího bodu k již existující dvojici
8. výpočet délek větví a celkové délky stromu
… a tak pořád dokola
CA
B
D
E
… testování kvality stromu, obvykle metoda bootstrap:» náhodné nahrazení znaků» výpočet nového stromu» to celé min. 1000×» % nových stromů, kde shluk z původního stromu je přítomen
Neighbour-joining
► výsledkem nezakořeněný strom» délky větví odrážejí původní distance
» lze zakořenit, pokud je v analýze nějakýoutgroup
Hilpold et al. 2011Centaurea cineraria, AFLP
Casimiro-Soriguer et al. 2011Erophaca (Fabaceae), AFLP
Neighbour-net
► Jeden z typů fylogenetických sítí► Obecně pro distanční matice,
ale nejčastěji AFLP data► síť zohledňuje nejistotu
v podobnosti / příbuznosti» každá „čára“ (edge) zobrazuje
rozdělení (split) dat na 2 sku-piny, rovnoběžné edges zobrazují tentýž split
» možné spojení se 2 různýmisousedy se projeví jako „box“
» není to fylogeneze, „interní“ bodynejsou hypotetičtí předci!
» délky odpovídají pův. distanci, poměr délek „síle“ konfliktních signálů
Bryant & Moulton 2004Huson & Bryant 2006obě v Molecular Biology and Evolution
Winkler et al. 2012, Mol. Ecol.Saxifraga oppositifolia, AFLP
Neighbour-net
► příklad dat s opravdu nejasnou strukturou» prakticky nelze zobrazit v podobě stromu
Hörandl & Emadzade 2012Ranunculus „clade III“sekvence ITS + cpDNA
Prostorové závislosti / autokorelace
► Jak se mění genetická podobnost jedinců / populací v závislosti na jejich vzdálenosti?
► Respektive – do jaké vzdálenosti lze ještě považovat jedince / populace za příbuzné
► Příbuznost populací na kontinentální škále (migrace v postglaciálu apod.)
► Šíření semen / pylu
► Jemná genetická struktura populací, isolation by distance,…
Mantelův test
► testuje podobnost (korelaci) dvou matic
► matice genetické a geografické vzdálenosti» třídy vzdálenosti
► permutační test:» výpočet korelačního koeficientu pro odpovídající si pozice v matici 1 a
2 („přes jedince“), testová statistika RM
» permutace (náhodné zpřeházení) jedné z matic» výpočet nového korelačního koeficientu» to celé mnohokrát (≥ 1000×)» signifikance = podíl hodnot vyšších než původní výsledek, větš.
Bonferroniho korekce
Gabrielsen et al. 1997Saxifraga oppositifolia, RAPD
log stupnice
RM > 0
RM < 0
RM ~ 0 (neprůkazné)
Moranovo I
► koeficient pro výpočet prostorové korelace» Mantel test – jednosměrná korelace (porovnání dvou distancí)
» Moran’s I – bere v úvahu podobnost v ploše nebo dokonce v prostoru (matice)
• srovnává podobnost 2 bodů v hodnotě dané proměnné, kterou váží váhou odvozenou z geografické pozice, suma přes všechny body
I ~ -1 max. negativní autokorelace
I = -1/(n-1) náhodné rozmístění
I ~ +1 max. pozitivní autokorelace• …ale velmi různé aplikace = způsoby stanovování podobnosti i
vah
Moranovo I
► aplikace na genetická data» binární proměnná – např. výskyt jedinců jedné / druhé ploidie» genet. podobnost - např. software SGS (spatial genetic
structure)• rozdělí vzdálenosti mezi vzorky do zadaného počtu stejně
širokých intervalů• genetická podobnost – přítomnost dané alely u kodominantních
dat (homozygot = 1, heterozygot = 0.5, nemá = 0), resp. přítomnost daného multilokusového genotypu (haplotypu) u dominantních dat (přítomen = 1, jinak 0)
• váha – „po intervalech“, pokud vzorky padnou do stejného intervalu = 1, jinak = 0
• pro každý pár vzorků dosazení do vzorce (viz např. manuál k programu), výpočet korelace
• permutační test
Kinship coefficient apod.► pravděpodobnost, že 2 alely náhodně
vybrané ze 2 jedinců budou stejné (IDB, identical by descent) (0-0.25)
► v souvislosti s populačními daty – genetická podobnost dvou jedinců ve srovnání s průměrem celé populace (IIS, identity in state) (průměr 0, + i -)
► Specializovaný software (např. SpaGeDi)» nelze pro dané 2 jedince» průměr z mnoha párů» počítáno pro vzdálenostní
třídy (v rámci třídy očeká-váme stejnou příbuznost)
» permutační testy proti 0
Jump et al. 2009, Fumana thymifolia, AFLP
kinship coeff.
konfidenční interval
Hardy & Vekemans 1999, Heredity 83: 145-154
Hardy 2003, Mol. Ecol. 12: 1577–1588
Bayesian clustering
► hledání nejpravděpodobnějšího rozdělení jedinců do k skupin» distance-based approach
• vztahy mezi jedinci jsou popsány maticí vzdáleností• matici reprezentujeme nějakou vhodnou analytickou metodou (shluková
analýza, NJ strom nebo síť, PCoA…)• vymezení skupin ± subjektivní, obtížné / nemožné testovat
vs.
» model-based approach• jedinci jsou náhodným výběrem z nějakého základního souboru• základní soubor je statisticky popsatelný několika parametry (frekvence
alel, počet skupin,…)• odhadujeme tyto parametry a jim odpovídající pravděpodobnost daného
rozdělení jedinců do skupin• hledání nejpravděpodobnější varianty, statistické testování
Bayesian clustering
► hledání nejpravděpodobnějšího rozdělení jedinců do k skupin
► k není dopředu známo
► uvnitř skupin se předpokládá:» Hardy-Weinbergova rovnováha
» nezávislost lokusů (linkage equilibrium)
» v podstatě se hledá rozdělení do skupin tak, aby data ve výsledku co nejvíce splňovala tyto předpoklady
» … a aby jedinci uvnitř skupin si byli co nejpodobnější (takové řešení je nejpravděpodobnější)
Bayesian clustering
► několik programů» podobná základní logika a výstupy, liší se matematické
postupy (podstatně)» STRUCTURE» BAPS (Bayesian Analysis of Population Structure)» další (např. Geneland, NewHybrids,…)
► několik modelů různé složitosti» každý jedinec geneticky náleží do právě jedné skupiny
(populace ve statistickém smyslu)» genotyp jedince může být směsí alel pocházejících z různých
populací (admixture model)» modely beroucí v úvahu geografický původ jedinců apod.» modely beroucí v úvahu vazbu (linkage) mezi lokusy
Bayesian clustering
Typické výstupy
► počet skupin, odhad kvality modelu» likelihood apod.,
pro STRUCTURE:likelihood, ΔK
► rozdělení jedinců to skupin
► pravděpodobnost, žejedinec patří do určitéskupiny» graf
Lousada et al. 2011, Genetica 139: 431-440Vellozia gigantea, ISSR
Software► GenAlEx (Genetic Analysis in Excel)
http://biology.anu.edu.au/GenAlEx/Welcome.htmlsada maker v Excelu, většina populačně genetických analýz, Mantel test, matice vzdáleností, export do formátů jiných programů
► Popgene http://www.ualberta.ca/~fyeh/popgene.htmlpopulační genetika obecně
► Arlequin http://cmpg.unibe.ch/software/arlequin3/populační genetika obecně, AMOVA, pairwaise-FST
► GENEPOP http://genepop.curtin.edu.au/populační genetika obecně
► TFPGA (Tools For Population Genetic Analyses)http://www.marksgeneticsoftware.net/tfpga.htmpopulační genetika obecně
► FSTAT http://www2.unil.ch/popgen/softwares/fstat.htmF-statistiky pro kodominantní markery, permutační testy,…
Software► Geneland http://www2.imm.dtu.dk/~gigu/Geneland/
populační genetika obecně, založeno na R► R http://www.r-project.org/
knihovny (package): popgen,genetics, poppr, diveRsity, pegas, ape,…► FAMD (Fingerprint Analysis with Missing Data)
http://www.famd.me.uk/famd.htmlgenet. distance, AMOVA, konverze formátů pro další programy,…
► AFLPdat http://www.nhm.uio.no/english/research/ncb/aflpdat/sada funkcí pro R– konverze 0/1 matice v .txt do různých formátů,DW index, gene diversity, a pár dalších
► SplitsTree4 http://www.splitstree.org/fylogenetické sítě
► Hickory http://darwin.eeb.uconn.edu/hickory/hickory.htmlpravděpodobností (Bayes) odhad frekvencí alel a F-statistik
► MLTR http://genetics.forestry.ubc.ca/ritland/programs.htmlmax. likelihood odhady cizosprášení / autogamie, inbreedingu,…
Software► SGS (Spatial Genetics Software)
http://software.bfh-inst2.de/download3.htmlvýpočet prostorové statistiky (Moranovo I, apod.) z genetických dat
► SpaGeDi (Spatial Pattern Analysis of Genetic Diversity)http://ebe.ulb.ac.be/ebe/Software.html
► BAPS (Bayesian Analysis of Population Structure)http://www.helsinki.fi/bsg/software/odhad populační struktury (Bayesian clustering)
► STRUCTURE http://pritch.bsd.uchicago.edu/structure.htmlodhad populační struktury (Bayesian clustering)» na stránce odkazy na software pro tvorbu grafických výstupů
► NewHybrids http://ib.berkeley.edu/labs/slatkin/eriq/software/software.htmodhad frekvencí alel a původu jedinců u předpokládané hybridizace (F1, F2, zpětní kříženci, …) na základě Bayesian clustering