Finding Regulatory Motifs in DNA Sequenceswkloster/4461/part3.pdf · An Introduction to...

www.bioalgorithms.infoAn Introduction to Bioinformatics Algorithms

Finding Regulatory Motifs in Finding Regulatory Motifs in Finding Regulatory Motifs in Finding Regulatory Motifs in DNA SequencesDNA SequencesDNA SequencesDNA Sequences

An Introduction to Bioinformatics Algorithms www.bioalgorithms.info

Outline• Implanting Patterns in Random Text

• Gene Regulation

• Regulatory Motifs

• The Gold Bug Problem

• The Motif Finding Problem

• Brute Force Motif Finding

• The Median String Problem

• Search Trees

• Branch-and-Bound Motif Search

• Branch-and-Bound Median String Search

• Consensus and Pattern Branching: Greedy Motif Search

• PMS: Exhaustive Motif Search

Random Sampleatgaccgggatactgataccgtatttggcctaggcgtacacattagataaacgtatgaagtacgatgaccgggatactgataccgtatttggcctaggcgtacacattagataaacgtatgaagtacgatgaccgggatactgataccgtatttggcctaggcgtacacattagataaacgtatgaagtacgatgaccgggatactgataccgtatttggcctaggcgtacacattagataaacgtatgaagtacgttagactcggcgccgccgttagactcggcgccgccgttagactcggcgccgccgttagactcggcgccgccg

acccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaatactgggcataaggtacatactgggcataaggtacatactgggcataaggtacatactgggcataaggtaca

tgagtatccctgggatgacttttgggaacactatagtgctctcccgatttttgaatatgtaggatgagtatccctgggatgacttttgggaacactatagtgctctcccgatttttgaatatgtaggatgagtatccctgggatgacttttgggaacactatagtgctctcccgatttttgaatatgtaggatgagtatccctgggatgacttttgggaacactatagtgctctcccgatttttgaatatgtaggatcattcgccagggtccgatcattcgccagggtccgatcattcgccagggtccgatcattcgccagggtccga

gctgagaattggatgaccttgtaagtgttttccacgcaatcgcgaaccaacgcggacccaaagggctgagaattggatgaccttgtaagtgttttccacgcaatcgcgaaccaacgcggacccaaagggctgagaattggatgaccttgtaagtgttttccacgcaatcgcgaaccaacgcggacccaaagggctgagaattggatgaccttgtaagtgttttccacgcaatcgcgaaccaacgcggacccaaaggcaagaccgataaaggagacaagaccgataaaggagacaagaccgataaaggagacaagaccgataaaggaga

tcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaatggcctcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaatggcctcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaatggcctcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaatggcccacttagtccacttatagcacttagtccacttatagcacttagtccacttatagcacttagtccacttatag

gtcaatcatgttcttgtgaatggatttttaactgagggcatagaccgcttggcgcacccaaattgtcaatcatgttcttgtgaatggatttttaactgagggcatagaccgcttggcgcacccaaattgtcaatcatgttcttgtgaatggatttttaactgagggcatagaccgcttggcgcacccaaattgtcaatcatgttcttgtgaatggatttttaactgagggcatagaccgcttggcgcacccaaattcagtgtgggcgagcgcaacagtgtgggcgagcgcaacagtgtgggcgagcgcaacagtgtgggcgagcgcaa

cggttttggcccttgttagaggcccccgtactgatggaaactttcaattatgagagagctaatccggttttggcccttgttagaggcccccgtactgatggaaactttcaattatgagagagctaatccggttttggcccttgttagaggcccccgtactgatggaaactttcaattatgagagagctaatccggttttggcccttgttagaggcccccgtactgatggaaactttcaattatgagagagctaatctatcgcgtgcgtgttcattatcgcgtgcgtgttcattatcgcgtgcgtgttcattatcgcgtgcgtgttcat

aacttgagttggtttcgaaaatgctctggggcacatacaagaggagtcttccttatcagttaataacttgagttggtttcgaaaatgctctggggcacatacaagaggagtcttccttatcagttaataacttgagttggtttcgaaaatgctctggggcacatacaagaggagtcttccttatcagttaataacttgagttggtttcgaaaatgctctggggcacatacaagaggagtcttccttatcagttaatgctgtatgacactatgtagctgtatgacactatgtagctgtatgacactatgtagctgtatgacactatgta

ttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatttcaacgtatttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatttcaacgtatttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatttcaacgtatttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatttcaacgtatgccgaaccgaaagggaaggccgaaccgaaagggaaggccgaaccgaaagggaaggccgaaccgaaagggaag

ctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcttctgggtactgatagcattctgggtactgatagcattctgggtactgatagcattctgggtactgatagca

Implanting Motif AAAAAAAGGGGGGGAAAAAAAGGGGGGGAAAAAAAGGGGGGGAAAAAAAGGGGGGG

atgaccgggatactgatatgaccgggatactgatatgaccgggatactgatatgaccgggatactgatAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGggcgtacacattagataaacgtatgaagtacgttagactcggcgccgccgggcgtacacattagataaacgtatgaagtacgttagactcggcgccgccgggcgtacacattagataaacgtatgaagtacgttagactcggcgccgccgggcgtacacattagataaacgtatgaagtacgttagactcggcgccgccg

acccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaatatatataAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGaaaa

tgagtatccctgggatgactttgagtatccctgggatgactttgagtatccctgggatgactttgagtatccctgggatgacttAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGtgctctcccgatttttgaatatgtaggatcattcgccagggtccgatgctctcccgatttttgaatatgtaggatcattcgccagggtccgatgctctcccgatttttgaatatgtaggatcattcgccagggtccgatgctctcccgatttttgaatatgtaggatcattcgccagggtccga

gctgagaattggatggctgagaattggatggctgagaattggatggctgagaattggatgAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGtccacgcaatcgcgaaccaacgcggacccaaaggcaagaccgataaaggagatccacgcaatcgcgaaccaacgcggacccaaaggcaagaccgataaaggagatccacgcaatcgcgaaccaacgcggacccaaaggcaagaccgataaaggagatccacgcaatcgcgaaccaacgcggacccaaaggcaagaccgataaaggaga

tcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaattcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaattcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaattcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaatAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGcttatagcttatagcttatagcttatag

gtcaatcatgttcttgtgaatggatttgtcaatcatgttcttgtgaatggatttgtcaatcatgttcttgtgaatggatttgtcaatcatgttcttgtgaatggatttAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGgaccgcttggcgcacccaaattcagtgtgggcgagcgcaagaccgcttggcgcacccaaattcagtgtgggcgagcgcaagaccgcttggcgcacccaaattcagtgtgggcgagcgcaagaccgcttggcgcacccaaattcagtgtgggcgagcgcaa

cggttttggcccttgttagaggcccccgtcggttttggcccttgttagaggcccccgtcggttttggcccttgttagaggcccccgtcggttttggcccttgttagaggcccccgtAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGcaattatgagagagctaatctatcgcgtgcgtgttcatcaattatgagagagctaatctatcgcgtgcgtgttcatcaattatgagagagctaatctatcgcgtgcgtgttcatcaattatgagagagctaatctatcgcgtgcgtgttcat

aacttgagttaacttgagttaacttgagttaacttgagttAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGctggggcacatacaagaggagtcttccttatcagttaatgctgtatgacactatgtactggggcacatacaagaggagtcttccttatcagttaatgctgtatgacactatgtactggggcacatacaagaggagtcttccttatcagttaatgctgtatgacactatgtactggggcacatacaagaggagtcttccttatcagttaatgctgtatgacactatgta

ttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGaccgaaagggaagaccgaaagggaagaccgaaagggaagaccgaaagggaag

ctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcttttttttAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGAAAAAAAAGGGGGGGaaaa

Where is the Implanted Motif? atgaccgggatactgataaaaaaaagggggggggcgtacacattagataaacgtatgaagtacgatgaccgggatactgataaaaaaaagggggggggcgtacacattagataaacgtatgaagtacgatgaccgggatactgataaaaaaaagggggggggcgtacacattagataaacgtatgaagtacgatgaccgggatactgataaaaaaaagggggggggcgtacacattagataaacgtatgaagtacgttagactcggcgccgccgttagactcggcgccgccgttagactcggcgccgccgttagactcggcgccgccg

acccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaataaaaaaaaagggggggataaaaaaaaagggggggataaaaaaaaagggggggataaaaaaaaaggggggga

tgagtatccctgggatgacttaaaaaaaagggggggtgctctcccgatttttgaatatgtaggatgagtatccctgggatgacttaaaaaaaagggggggtgctctcccgatttttgaatatgtaggatgagtatccctgggatgacttaaaaaaaagggggggtgctctcccgatttttgaatatgtaggatgagtatccctgggatgacttaaaaaaaagggggggtgctctcccgatttttgaatatgtaggatcattcgccagggtccgatcattcgccagggtccgatcattcgccagggtccgatcattcgccagggtccga

gctgagaattggatgaaaaaaaagggggggtccacgcaatcgcgaaccaacgcggacccaaagggctgagaattggatgaaaaaaaagggggggtccacgcaatcgcgaaccaacgcggacccaaagggctgagaattggatgaaaaaaaagggggggtccacgcaatcgcgaaccaacgcggacccaaagggctgagaattggatgaaaaaaaagggggggtccacgcaatcgcgaaccaacgcggacccaaaggcaagaccgataaaggagacaagaccgataaaggagacaagaccgataaaggagacaagaccgataaaggaga

tcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaataaaatcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaataaaatcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaataaaatcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaataaaaaaaagggggggcttatagaaaagggggggcttatagaaaagggggggcttatagaaaagggggggcttatag

gtcaatcatgttcttgtgaatggatttaaaaaaaaggggggggaccgcttggcgcacccaaattgtcaatcatgttcttgtgaatggatttaaaaaaaaggggggggaccgcttggcgcacccaaattgtcaatcatgttcttgtgaatggatttaaaaaaaaggggggggaccgcttggcgcacccaaattgtcaatcatgttcttgtgaatggatttaaaaaaaaggggggggaccgcttggcgcacccaaattcagtgtgggcgagcgcaacagtgtgggcgagcgcaacagtgtgggcgagcgcaacagtgtgggcgagcgcaa

cggttttggcccttgttagaggcccccgtaaaaaaaagggggggcaattatgagagagctaatccggttttggcccttgttagaggcccccgtaaaaaaaagggggggcaattatgagagagctaatccggttttggcccttgttagaggcccccgtaaaaaaaagggggggcaattatgagagagctaatccggttttggcccttgttagaggcccccgtaaaaaaaagggggggcaattatgagagagctaatctatcgcgtgcgtgttcattatcgcgtgcgtgttcattatcgcgtgcgtgttcattatcgcgtgcgtgttcat

aacttgagttaaaaaaaagggggggctggggcacatacaagaggagtcttccttatcagttaataacttgagttaaaaaaaagggggggctggggcacatacaagaggagtcttccttatcagttaataacttgagttaaaaaaaagggggggctggggcacatacaagaggagtcttccttatcagttaataacttgagttaaaaaaaagggggggctggggcacatacaagaggagtcttccttatcagttaatgctgtatgacactatgtagctgtatgacactatgtagctgtatgacactatgtagctgtatgacactatgta

ttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcataaaaaaaaggttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcataaaaaaaaggttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcataaaaaaaaggttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcataaaaaaaagggggggaccgaaagggaaggggggaccgaaagggaaggggggaccgaaagggaaggggggaccgaaagggaag

ctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcttaaaaaaaagggggggattaaaaaaaagggggggattaaaaaaaagggggggattaaaaaaaaggggggga

Implanting Motif AAAAAAGGGGGGG

with Four Mutations

atgaccgggatactgatatgaccgggatactgatatgaccgggatactgatatgaccgggatactgatAAAAggggAAAAAAAAggggAAAGGAAAGGAAAGGAAAGGttttttttGGGGGGGGGGGGggcgtacacattagataaacgtatgaagtacgttagactcggcgccgccgggcgtacacattagataaacgtatgaagtacgttagactcggcgccgccgggcgtacacattagataaacgtatgaagtacgttagactcggcgccgccgggcgtacacattagataaacgtatgaagtacgttagactcggcgccgccg

acccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaatatatataccccAAAAAAAAttttAAAAAAAAAAAAAAAAccccGGGGGGGGccccGGGGGGGGGGGGaaaa

tgagtatccctgggatgactttgagtatccctgggatgactttgagtatccctgggatgactttgagtatccctgggatgacttAAAAAAAAAAAAAAAAttttAAAAAAAAttttGGGGGGGGaaaaGGGGttttGGGGGGGGtgctctcccgatttttgaatatgtaggatcattcgccagggtccgatgctctcccgatttttgaatatgtaggatcattcgccagggtccgatgctctcccgatttttgaatatgtaggatcattcgccagggtccgatgctctcccgatttttgaatatgtaggatcattcgccagggtccga

gctgagaattggatggctgagaattggatggctgagaattggatggctgagaattggatgccccAAAAAAAGGGAAAAAAAGGGAAAAAAAGGGAAAAAAAGGGattattattattGGGGtccacgcaatcgcgaaccaacgcggacccaaaggcaagaccgataaaggagatccacgcaatcgcgaaccaacgcggacccaaaggcaagaccgataaaggagatccacgcaatcgcgaaccaacgcggacccaaaggcaagaccgataaaggagatccacgcaatcgcgaaccaacgcggacccaaaggcaagaccgataaaggaga

tcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaattcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaattcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaattcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaatAAAAttttAAAAAAAAttttAAAGGAAAGGAAAGGAAAGGaaaaaaaaGGGGGGGGGGGGcttatagcttatagcttatagcttatag

gtcaatcatgttcttgtgaatggatttgtcaatcatgttcttgtgaatggatttgtcaatcatgttcttgtgaatggatttgtcaatcatgttcttgtgaatggatttAAAAAAAAccccAAAAAAAAttttAAGGGAAGGGAAGGGAAGGGctctctctGGGGGGGGgaccgcttggcgcacccaaattcagtgtgggcgagcgcaagaccgcttggcgcacccaaattcagtgtgggcgagcgcaagaccgcttggcgcacccaaattcagtgtgggcgagcgcaagaccgcttggcgcacccaaattcagtgtgggcgagcgcaa

cggttttggcccttgttagaggcccccgtcggttttggcccttgttagaggcccccgtcggttttggcccttgttagaggcccccgtcggttttggcccttgttagaggcccccgtAAAAttttAAAAAAAAAAAAccccAAGGAAGGAAGGAAGGaaaaGGGGGGGGGGGGcccccaattatgagagagctaatctatcgcgtgcgtgttcatcaattatgagagagctaatctatcgcgtgcgtgttcatcaattatgagagagctaatctatcgcgtgcgtgttcatcaattatgagagagctaatctatcgcgtgcgtgttcat

aacttgagttaacttgagttaacttgagttaacttgagttAAAAAAAAAAAAAAAAAAAAAAAAttttAGGGAGGGAGGGAGGGaaaaGGGGccccccccctggggcacatacaagaggagtcttccttatcagttaatgctgtatgacactatgtactggggcacatacaagaggagtcttccttatcagttaatgctgtatgacactatgtactggggcacatacaagaggagtcttccttatcagttaatgctgtatgacactatgtactggggcacatacaagaggagtcttccttatcagttaatgctgtatgacactatgta

ttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatAAAActctctctAAAAAGGAAAAAGGAAAAAGGAAAAAGGaaaaGGGGccccGGGGGGGGaccgaaagggaagaccgaaagggaagaccgaaagggaagaccgaaagggaag

ctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcttttttttAAAActctctctAAAAAGGAAAAAGGAAAAAGGAAAAAGGaaaaGGGGccccGGGGGGGGaaaa

Where is the Motif??? atgaccgggatactgatagaagaaaggttgggggcgtacacattagataaacgtatgaagtacgatgaccgggatactgatagaagaaaggttgggggcgtacacattagataaacgtatgaagtacgatgaccgggatactgatagaagaaaggttgggggcgtacacattagataaacgtatgaagtacgatgaccgggatactgatagaagaaaggttgggggcgtacacattagataaacgtatgaagtacgttagactcggcgccgccgttagactcggcgccgccgttagactcggcgccgccgttagactcggcgccgccg

acccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaaacccctattttttgagcagatttagtgacctggaaaaaaaatttgagtacaaaacttttccgaatacaataaaacggcgggatacaataaaacggcgggatacaataaaacggcgggatacaataaaacggcggga

tgagtatccctgggatgacttaaaataatggagtggtgctctcccgatttttgaatatgtaggatgagtatccctgggatgacttaaaataatggagtggtgctctcccgatttttgaatatgtaggatgagtatccctgggatgacttaaaataatggagtggtgctctcccgatttttgaatatgtaggatgagtatccctgggatgacttaaaataatggagtggtgctctcccgatttttgaatatgtaggatcattcgccagggtccgatcattcgccagggtccgatcattcgccagggtccgatcattcgccagggtccga

gctgagaattggatgcaaaaaaagggattgtccacgcaatcgcgaaccaacgcggacccaaagggctgagaattggatgcaaaaaaagggattgtccacgcaatcgcgaaccaacgcggacccaaagggctgagaattggatgcaaaaaaagggattgtccacgcaatcgcgaaccaacgcggacccaaagggctgagaattggatgcaaaaaaagggattgtccacgcaatcgcgaaccaacgcggacccaaaggcaagaccgataaaggagacaagaccgataaaggagacaagaccgataaaggagacaagaccgataaaggaga

tcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaatataatcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaatataatcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaatataatcccttttgcggtaatgtgccgggaggctggttacgtagggaagccctaacggacttaatataataaaggaagggcttatagtaaaggaagggcttatagtaaaggaagggcttatagtaaaggaagggcttatag

gtcaatcatgttcttgtgaatggatttaacaataagggctgggaccgcttggcgcacccaaattgtcaatcatgttcttgtgaatggatttaacaataagggctgggaccgcttggcgcacccaaattgtcaatcatgttcttgtgaatggatttaacaataagggctgggaccgcttggcgcacccaaattgtcaatcatgttcttgtgaatggatttaacaataagggctgggaccgcttggcgcacccaaattcagtgtgggcgagcgcaacagtgtgggcgagcgcaacagtgtgggcgagcgcaacagtgtgggcgagcgcaa

cggttttggcccttgttagaggcccccgtataaacaaggagggccaattatgagagagctaatccggttttggcccttgttagaggcccccgtataaacaaggagggccaattatgagagagctaatccggttttggcccttgttagaggcccccgtataaacaaggagggccaattatgagagagctaatccggttttggcccttgttagaggcccccgtataaacaaggagggccaattatgagagagctaatctatcgcgtgcgtgttcattatcgcgtgcgtgttcattatcgcgtgcgtgttcattatcgcgtgcgtgttcat

aacttgagttaaaaaatagggagccctggggcacatacaagaggagtcttccttatcagttaataacttgagttaaaaaatagggagccctggggcacatacaagaggagtcttccttatcagttaataacttgagttaaaaaatagggagccctggggcacatacaagaggagtcttccttatcagttaataacttgagttaaaaaatagggagccctggggcacatacaagaggagtcttccttatcagttaatgctgtatgacactatgtagctgtatgacactatgtagctgtatgacactatgtagctgtatgacactatgta

ttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatactaaaaaggttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatactaaaaaggttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatactaaaaaggttggcccattggctaaaagcccaacttgacaaatggaagatagaatccttgcatactaaaaaggagcggaccgaaagggaagagcggaccgaaagggaagagcggaccgaaagggaagagcggaccgaaagggaag

ctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcctggtgagcaacgacagattcttacgtgcattagctcgcttccggggatctaatagcacgaagcttactaaaaaggagcggattactaaaaaggagcggattactaaaaaggagcggattactaaaaaggagcgga

Why Finding (15,4) Motif is Difficult?