Pontifícia Universidade Católica de São Paulo PUC-SP Cristina … · 2017-02-22 · Amo muito!...
Transcript of Pontifícia Universidade Católica de São Paulo PUC-SP Cristina … · 2017-02-22 · Amo muito!...
Pontifícia Universidade Católica de São Paulo PUC-SP
Cristina Canhetti Alves
Efeitos das metáforas no ensino do canto: dados acústicos e de imagem do trato vocal
Mestrado em Linguística Aplicada e Estudos da Linguagem
São Paulo 2013
Cristina Canhetti Alves
Efeitos das metáforas no ensino do canto: dados acústicos e de imagem do trato vocal
MESTRADO EM LINGUÍSTICA APLICADA E ESTUDOS DA LINGUAGEM
Dissertação apresentada à Banca Examinadora da Pontifícia Universidade Católica de São Paulo, como exigência parcial para obtenção do título de MESTRE em Linguística Aplicada e Estudos da Linguagem sob a orientação da Profa. Doutora Zuleica Camargo.
São Paulo 2013
ii
Alves Cristina Canhetti Efeitos das metáforas no ensino do canto: dados acústicos e de imagem do trato vocal/ Alves, Cristina Canhetti - São Paulo, 2013, p.165. Dissertação (mestrado) Pontifícia Universidade Católica de São Paulo. Programa de Estudos Pós-Graduados em Lingüística Aplicada e Estudos da Linguagem. Título em inglês: Effects of metaphors in the teaching of singing: acoustic and vocal tract image data 1. Acústica 2.Canto 3.Fisiologia 4.Metáfora 5.Fonética
iii
Banca Examinadora
------------------------------------------------- ------------------------------------------------- -------------------------------------------------
Data: _____/_____/_____
iv
AUTORIZAÇÃO
Autorizo, exclusivamente para fins acadêmicos e científicos, a reprodução total
ou parcial desta dissertação por processos de fotocopiadoras ou eletrônicos. Cristina Canhetti Alves _________________________________ São Paulo, de de 2013.
v
Dedico este trabalho Aos meus pais, Fátima e José Carlos e á minha avó materna Maria por sempre acreditarem em mim. Ao meu amor, Pedro Henrique, por todo o incentivo e por sonhar comigo que tudo isso seria possível.
vi
Agradecimentos
À minha orientadora Profa Dra Zuleica Camargo, que esteve sempre presente me
incentivando em todas as etapas, que me inspira pela sua dedicação e pela
profissional competente em nossa profissão.
À Profa Dra Sandra Madureira, por todos os ensinamentos, pela paciência, pela
serenidade e que agregou muito durante toda essa jornada.
À minha mãe, Fátima por me incentivar, acreditar tanto em mim e mesmo diante de
todas as dificuldades tornar possível o impossível. Ao meu pai, José Carlos, por
depositar confiança em minhas escolhas. Amo muito!
Ao meu amor, Pedro Henrique, pela paciência por minhas ausências, pelo carinho,
companheirismo, pela ajuda e por se orgulhar tanto de quem eu sou. Amo-te!
A minha vózinha materna, Maria, que com seus 88 anos se interessa pela
fonoaudiologia e está sempre presente e rezando para que tudo corra bem.
À minha família, por estarem ao meu lado em todos os momentos.
Às amigas Andrea e Maria Augusta, duas pessoas mais que queridas, companheiras
e que fizeram meus dias mais divertidos.
À Aline Pessoa, por todas as ajudas, em qualquer hora e por qualquer motivo. Você
é uma pessoa fantástica e teve papel fundamental em todo meu percurso.
À Luciana Oliveira, pela disponibilidade, pelos ensinamentos e por ser essa pessoa
tão serena que em momentos turbulentos consegue ver a luz no fim do túnel.
vii
À Fabiana Gregio, por estar presente e me auxiliando desde minha iniciação
científica. Agradeço muito.
À Roberta Isolan Cury pela ajuda, parceria e por me incentivar a não desistir de
nenhum desafio.
Ao Marcelo Barbosa pelas revisões do inglês e por ser tão divertido e autêntico.
À Mária de Fátima Albuquerque do LIAAC e á Maria Lucia do LAEL, pela simpatia e
pela colaboração em todas as etapas.
Ao Prof Luiz Carlos Rusilo, pelas análises estatísticas. Ao Ronaldo Barbosa e à Janaina Paiva pelos importantes momentos no Laboratório
de Rádio. Obrigada pela ajuda e acima de tudo pelas risadas.
Aos meus colegas do grupo do LIAAC, agradeço o apoio e incentivo.
Ao Prof. Dr. Johan Sundberg e à Dra. Glaucia Salomão por permitirem minha visita à
KTH, pela brilhante discussão dos dados de minha pesquisa e pela experiência
valiosa.
Ao grupo de estudo que tive o prazer em conhecer em Budapeste, agradeço por
todas as descobertas. Especialmente, Lila Pintér, Maria Patona e Diána Varga pelo
carinho e auxílio constante.
Ao técnico da radiologia Vitor pela disponibilidade, auxílio e simpatia.
À Deborah Manguino, pela valorização constante, por acreditar em minha
capacidade e se orgulhar dos resultados. Obrigada por todos os desafios!
viii
À minha querida, Deborah Donda e ao grupo Support, por compreenderem essa
etapa e torcerem tanto por mim. Obrigada pela paciência!
Aos Amigos, pela torcida, por compreender minhas ausências e rirem dos meus
momentos em stand by.
A todos os sujeitos que participaram da minha pesquisa.
À FAPESP, pelo apoio financeiro para execução dessa pesquisa.
ix
Lista de Quadros
Quadro 1. Descrição dos sujeitos participantes da pesquisa.............................. 30
x
Lista de Figuras
Figura 1. Medida de abertura de lábios absoluta (mm) gerada pelo software Osiris 25
Figura 2. Medida de abertura de mandíbula (mm) gerada pelo software Osiris...... 26
Figura 3. Medida de abertura de lábios normalizada (mm) gerada pelo software
Osiris........................................................................................................................
26
Figura 4. Medida da distância de língua-faringe (mm) gerada pelo software Osiris 27
Figura 5. Medida da distância de língua-palato de uma vogal anterior [Ɛ] (mm)
gerada pelo software Osiris....................................................................................
27
Figura 6. Medida da distância de língua-palato de uma vogal [a] posterior (mm)
gerada pelo software Osiris....................................................................................
27
Figura 7. Gráfico boxplot da distribuição das medidas de frequências formânticas
(F3) para três emissões da vogal [a] – a1, a2 e a3.................................................
38
Figura 8. Gráfico boxplot da distribuição das medidas de frequências formânticas(
F1) para três emissões da vogal [a] –a1, a2 e a3..................................................
38
Figura 9. Gráfico boxplot da distribuição das medidas de frequências formânticas
(F2) para três emissões da vogal [a] –a1, a2 e a3..................................................
38
Figura 10. Dados de imagem de trato vocal ilustrativo das medidas (em mm)
extraídas na situação de repouso.............................................................................
40
Figura 11. Dados de imagens de trato vocal ilustrativos das medidas (em mm)
extraídas das emissões em voz cantada produzidas sem intruções baseadas em
metáforas................................................................................................................
41
Figura 12. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de
imagens extraídas das emissões em voz cantada produzidas por meio de
instruções baseadas na metáfora prisma...............................................................
42
Figura 13. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de
imagens extraídas das emissões em voz cantada produzidas por meio de
instruções baseadas na metáfora catedral.............................................................
43
Figura 14. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de
imagens extraídas das emissões em voz cantada produzidas por meio de
instruções baseadas na metáfora disco voador......................................................
45
xi
Figura 15. Gráficos da análise de correlações para medidas de frequências
formânticas e medidas de imagem do trato vocal...................................................
50
Figura 16. Diagrama da análise fatorial de medidas de imagens do trato vocal e
de medidas acústicas de frequências formânticas (F1, F2 e F3)............................
51
Figura 17. Gráficos de análise de regressão linear de medidas de imagens do
trato vocal e de medidas acústicas de frequências formânticas (F1, F2 e F3).......
52
Figura 18. Gráficos de análise Ancova para relação de medidas acústicas das
frequências formânticas (F1, F2 e F3) em relação às metaforas (coluna à
esquerda) e às vogais analisadas (coluna à direita)...............................................
54
Figura 19. Gráfico de centróides da análise discriminante para estimação das
vogais a partir das medidas de frequências formânticas (F1, F2 e F3)...................
56
Figura 20. Gráfico de centróides da análise discriminante para estimação das
metáforas a partir das medidas de imagem do trato vocal......................................
57
Figura 21. Gráfico de centróides da análise discriminante para estimação das
vogais a partir das medidas de imagem do trato vocal............................................
58
Figura 22. Gráfico de centróides da análise discriminante para estimação das
metáforas a partir das medidas de frequências formânticas e de medidas de
imagem do trato vocal.............................................................................................
59
Figura 23. Gráfico radar da distribuição das frequências formânticas nas diversas
emissões estudadas................................................................................................
60
Figura 24. Gráfico radar da distribuição das medidas de imagens do trato vocal
nas diversas emissões estudadas...........................................................................
60
Figura 25. Gráfico de centróides da análise discriminante para estimação das
metáforas a partir das medidas acústicas (script Expression Evaluator e
frequências formânticas) .........................................................................................
66
Figura 26. Gráfico de centróides da análise discriminante para estimação das
metáforas a partir das medidas acústicas (script Expression Evaluator).................
67
xii
Figura 27. Gráfico de centróides da análise discriminante para estimação das
metáforas a partir das medidas (frequências formânticas)......................................
68
Figura 28. Gráfico de centróides da análise discriminante para estimação dos
grupos de cantoras e de não cantoras a partir das medidas acústicas (script
ExpressionEvaluator) .............................................................................................
71
Figura 29. Gráfico de centróides da análise discriminante para estimação dos
grupos de cantoras e de não cantoras a partir das medidas acústicas (frequências
formânticas-F1, F2 e F3) .......................................................................................
72
Figura 30. Gráfico de análise de regressão linear de medidas acústicas do script
ExpressionEvaluator e prontidão.............................................................................
73
Figura 31. Gráfico de análise de regressão linear de medidas acústicas de
frequências formânticas-F1, F2 e F3 para as várias emissões da vogal [a] (a1, a2,
a3) e prontidão.........................................................................................................
74
Figura 32. Gráfico de análise de regressão linear de medidas acústicas do script
ExpressionEvaluator conjugadas às de frequências formânticas (para as várias
emissões da vogal [a] -a1, a2, a3) e prontidão.......................................................
74
Figura 33. Gráfico de análise ANOVA de variáveis qualitativas: grupo (cantoras e
não cantoras), sujeitos, tipo de (emissão-metáforas) em relação à prontidão........
75
Figura 34. Gráfico de análise ANOVA de variáveis qualitativas (sujeitos) e
prontidão.................................................................................................................
76
Figura 35. Localização visual dos itens Meu Computador, Organizar e Opções de
pastas como procedimento para mudança de extensão de arquivo.......................
106
Figura 36. Localização visual dos itens Opções de Pasta, Modo de Exibição e
item que não deve ser selecionado como procedimento para mudança de
extensão de arquivo................................................................................................
106
Figura 37. Mensagem de confirmação para modificação da extensão do arquivo
selecionado.............................................................................................................
107
xiii
Figura 38. Arquivo cópia renomeado com a extensão pap..................................... 107
Figura 39. Localização do arquivo no software Osiris............................................. 108
Figura 40. Instrução de como salvar o arquivo em papyrus................................... 108
Figura 41. Renomear o arquivo que será salvo como papyrus............................... 108
Figura 42. Gerar o arquivo papyrus e iniciar a análise dos dados pelo software
Osiris.......................................................................................................................
108
Figura 43: Medida da distância entre o dente segundo pré-molar superior e o
mento (queixo) na situação de repouso..................................................................
131
Figura 44. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da
distância entre o dente segundo pré-molar superior e o mento extraídas das
emissões em voz cantada produzidas sem intruções baseadas em metáforas.....
131
Figura 45. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da
distância entre o dente segundo pré-molar superior e o mento extraídas das
emissões em voz cantada produzidas por meio de instruções baseadas na
metáfora prisma. ......................................................................................................
132
Figura 46. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da
distância entre o dente segundo pré-molar superior e o mento extraídas das
emissões em voz cantada produzidas por meio de instruções baseadas na
metáfora catedral. .................................................................................................
134
Figura 47. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da
distância entre o dente segundo pré-molar superior e o mento extraídas das
emissões em voz cantada produzidas por meio de instruções baseadas na
metáfora disco voador. ...........................................................................................
135
xiv
Lista de Tabelas
Tabela 1. Medidas de frequências formânticas (Hz) para as emissões em voz
cantada produzidas por meio de instruções baseadas em metáforas e sem
instruções baseadas em metáforas para as emissões de [a] sapo, [Ɛ] é que, [i] rio
e frio e [u] jururu......................................................................................................
46
Tabela 2. Medidas de imagem do trato vocal (mm) para as emissões em voz
cantada produzidas por meio de instruções baseadas em metáforas e sem
instruções baseadas em metáforas para as emissões [a] sapo, [Ɛ] é que, [i] rio e
frio e [u] jururu. ......................................................................................................
47
Tabela 3. Resultados de teste de correlação para medidas de frequências
formânticas e medidas de imagem do trato vocal (p<0,01)...................................
49
Tabela 4. Matriz de confusão para resultados de validação cruzada da análise
discriminante para vogais a partir das medidas acústicas de frequências
formânticas- F1, F2 e F3........................................................................................
55
Tabela 5. Matriz de confusão para resultados de validação cruzada da análise
discriminante para metáforas a partir das medidas de imagem do trato vocal......
56
Tabela 6. Matriz de confusão para resultados de validação cruzada da análise
discriminante para vogais a partir das medidas de imagem do trato vocal...........
58
Tabela 7. Matriz de confusão para resultados de validação cruzada da análise
discriminante para metáforas a partir das medidas acústicas de frequências
formânticas e de imagem do trato vocal................................................................
59
Tabela 8. Valores de médias e desvio padrão de medidas acústicas do script
ExpressonEvaluator para as emissões em voz cantada produzidas por meio de
instruções baseadas em metáforas (catedral, prisma e disco voador) e sem
instruções baseadas em metáforas.......................................................................
62
Tabela 9. Resultados do teste de distâncias de Fisher (p-valores) para as médias
de medidas acústicas do script ExpressionEvaluator para as emissões em voz
cantada produzidas por meio de instruções baseadas em metáforas (catedral,
prisma e disco voador) e sem instruções baseadas em metáforas......................
63
xv
Tabela 10. Valores de média e desvio padrão de medidas acústicas –
frequências formânticas- para as emissões produzidas por meio de instruções
baseadas em metáforas (catedral, prisma e disco voador) e sem instruções
baseadas em metáforas. .......................................................................................
64
Tabela 11. Resultados do teste de distâncias de Fisher (p-valores) para as
médias de medidas acústicas – frequências formânticas- para as emissões em
voz cantada produzidas por meio de instruções baseadas em metáforas
(catedral, prisma e disco voador) e sem instruções baseadas em metáforas........
65
Tabela 12. Matriz de confusão para resultados de validação cruzada da análise
discriminante para metáforas a partir das medidas acústicas (script Expression
Evaluator e frequências formânticas)......................................................................
66
Tabela 13. Matriz de confusão para resultados de validação cruzada da análise
discriminante para metáforas a partir das medidas acústicas (script
ExpressionEvaluator) ..............................................................................................
67
Tabela 14. Matriz de confusão para resultados de validação cruzada da análise
discriminante para metáforas a partir das medidas acústicas (frequências
formânticas) ..........................................................................................................
68
Tabela 15. Valores de médias e desvio padrão de medidas acústicas do script
ExpressionEvaluator para as emissões de cantoras e não cantoras....................
69
Tabela 16. Resultados do teste de distâncias de Fisher (p-valores) para as
médias de medidas acústicas do script ExpressionEvaluator para as emissões de
cantoras e não cantoras..........................................................................................
70
Tabela 17. Valores de média e desvio padrão de frequências formânticas para as
emissões 1, 2 e 3 da vogal [a] em “sapo” para as emissões de cantoras e não
cantoras.................................................................................................................
70
Tabela 18. Resultados do teste de distâncias de Fisher (p-valores) para as
médias de medidas acústicas – frequências formânticas (F1, F2 e F3)- para as
emissões 1, 2 e 3 da vogal [a] em “sapo” para as emissões de cantoras e não
cantoras.................................................................................................................
70
xvi
Tabela 19. Matriz de confusão para resultados de validação cruzada da análise
discriminante para grupo de cantoras e não cantoras a partir das medidas
acústicas (script ExpressionEvaluator)..................................................................
71
Tabela 20. Matriz de confusão para resultados de validação cruzada da análise
discriminante para grupo de cantoras e não cantoras a partir das medidas
acústicas (frequências formânticas-F, F2 e F3).....................................................
72
xvii
RESUMO
Com o objetivo de investigar, em amostras de voz cantada, os efeitos do uso das metáforas, a partir de descrições acústicas e articulatórias (imagens do trato vocal) de ajustes de qualidade vocal em mulheres cantoras e não cantoras, esta pesquisa foi desenvolvida com base em dois experimentos. Experimento 1 referiu-se a estudo de caso (mulher, não cantora, sem alterações vocais), pautado nas análises acústica e de imagem (videofluoroscopia) do trato vocal. Experimento 2 pautou-se em análise acústica das emissões de 10 sujeitos (5 cantoras e 5 não cantoras). Para ambos os experimentos, foram analisadas as gravações da canção infantil “Sapo Jururu” em quatro tarefas: sem instrução e com instruções baseadas nas metáforas prisma, catedral, disco voador. Para a análise das imagens do trato vocal, foram extraídas medidas de abertura de lábios (absoluta e normalizada), abertura de mandíbula, distância dorso de língua-faringe e dorso de língua-palato por meio do software Osiris. Para a análise acústica dos dados, foram extraídas as medidas de frequências formânticas (F1, F2, F3) das vogais ([a], [i], [Ɛ] e [u]) - software Praat no experimento 1. O experimento 2 constou da extração das medidas de F1, F2, F3 da vogal [a] (nas várias repetições de “sapo”) e da análise das três repetições da canção por meio da aplicação do script ExpressionEvaluator ao software Praat para extração de medidas de prontidão, f0 (mediana, semiamplitude entre quartis, quantil 99,5% e assimetria), primeira derivada de f0 (média, desvio padrão e assimetria), intensidade (assimetria), declínio espectral (média, desvio padrão e assimetria) e LTAS (desvio padrão). Os achados dos dois experimentos foram submetidos a tratamento estatístico de natureza multivariada (análises fatorial, aglomerativa hierárquica de cluster, de correlação canônica, discriminante e regressão linear). Em termos de análise de imagens, foi possível observar na metáfora catedral maior abertura de lábios e mandíbula, língua centralizada e expansão faríngea. Para a metáfora prisma maior abertura de lábios e constrição faríngea. Para o disco voador, encontrou-se menor abertura de lábios e mandíbula, língua elevada e expansão faríngea. A análise acústica revelou diferenciações do padrão formântico especialmente para as metáforas catedral e disco voador, complementadas por achados do experimento 2. A análise estatística revelou que mobilizações promovidas pelas metáforas foram melhor definidas pela análise de imagens no experimento 1 e pelas medidas geradas pelo script ExpressionEvaluator no experimento 2, com destaque para f0 (mediana e quantil 99,5%), intensidade (assimetria) e declínio espectral (média e desvio padrão). As diferenciações por grupos no experimento 2 foram reforçadas por medidas do script ExpressionEvaluator e F1, F2 e F3. A prontidão foi índice que revelou diferenças das produções inter-sujeitos. A análise fonética dos dados revelou que as metáforas geraram mobilizações diferenciadas no trato vocal, especialmente para catedral e disco voador, reveladas por descrições articulatórios (medidas de imagens videofluoroscópicas) e acústicas (f0, intensidade e declínio espectral). Tais mobilizações apresentaram diferenças quando comparados aos grupos estudados. As correspondências entre achados acústicos e de imagem do trato vocal foram relevantes ao enfoque da voz cantada e reforçaram as relações entre som e sentido. Descritores: Acústica; Canto; Fisiologia; Metáfora; Fonética
xviii
ABSTRACT
Aiming at investigating the effects of the usage of metaphors in singing voice production from acoustic and articulatory (vocal tract imaging) descriptions among women, singers and non-singers, this research was developed based on two experiments. Experiment 1 referred to a case study (woman, non-singer, without voice disorder) based on acoustic and vocal tract image analysis (videofluoroscopy). Experiment 2 was based on acoustic analysis of utterances from 10 subjects (5 singers and 5 non-singers). For both experiments, the recordings of the folklore song Sapo Jururu in four different tasks: without and with instructions, the latter based on metaphors (prism, cathedral and flying saucer) were analyzed. For vocal tract image data analysis, measures of labial opening (absolute and normalized), jaw opening, distance from the back of tongue-pharynx and back of tongue-palate were extracted by means of Osiris software. For the acoustic analysis of the data, measures of the formant frequencies (F1, F2, F3) of the vowels ([a], [i], [Ɛ] e [u]) were extracted by means of Praat software in experiment 1. Experiment 2 consisted on the extraction of F1, F2, F3 measures of the vowel [a] (in the repetitions of “sapo”) and on the analysis of the three repetitions of the folklore song by ExpressionEvaluator script running into Praat software to extract arousal, f0 (median, interquartile semi-amplitude, quantile 99.5% and skewness), first f0 derivate (mean, standard deviation and skewness), intensity (skewness), spectral slope (mean, standard deviation and skewness) and LTAS (standard deviation) measures. The findings of both experiments were submitted to multivariate statistical treatment (factorial analysis, agglomerative hierarchical clustering, canonical correlation, discriminant analysis and linear regression). The vocal tract image data revealed increased labial and jaw opening, centralized tongue body and pharyngeal expansion in the cathedral metaphor. For the prism metaphor, increased labial opening and pharyngeal constriction were found. For the flying saucer metaphor, decreased labial and jaw opening, raised tongue body, and pharyngeal expansion were found. The acoustic analysis showed differences in the formant pattern, mainly to the cathedral and flying saucer ones, supported by findings of experiment 2. The statistical analysis showed that mobilizations elicited by metaphors were better defined through image analysis in experiment 1 and by the acoustic measures generated by ExpressionEvaluator script in experiment 2, especially for f0 (median and quantile 99.5%), intensity (skewness) and spectral slope (mean and standard deviation). The differentiations among groups in experiment 2 were reinforced by ExpressionEvaluator and F1, F2, and F3 acoustic measures. The arousal was the factor which showed inter-subject differences. The phonetic approach of the data showed that metaphors lead to differentiated vocal tract adjustments, mainly for cathedral and flying saucer methaphors, revealed by articulatory (measures of videofluoroscopic images) and acoustic descriptions (f0, intensity and spectral slope measures). Those adjustments differed when singer and non-singer samples were compared. The acoustic and vocal tract images correspondences were relevant to the study of the singing voice, and reinforced the relation between sound and meaning. Keywords: Acoustics; Singing; Physiology; Metaphor; Phonetics
xix
Sumário
1. INTRODUÇÃO.................................................................................................. 01
2. OBJETIVO.......................................................................................................... 08
3. REVISÃO DE LITERATURA............................................................................ 09
3.1. A voz cantada e as instruções no canto baseadas em metáforas............ 09
3.2. Análise acústica e articulatória da voz cantada........................................ 14
3.3. Análise de imagens do trato vocal............................................................ 16
4. METODOLOGIA............................................................................................... 21
4.1. Experimento 1- Análise integrada de dados acústicos e de imagem do
trato vocal: um estudo de caso.......................................................................
21
4.1.1. Procedimentos de coleta de amostras de imagem do trato vocal e de
áudio durante a emissão em voz cantada produzida por meio de instruções
baseadas em metáforas.................................................................................
22
4.1.2. Procedimentos de edição e análise dos dados de imagem do trato
vocal................................................................................................................
24
4.1.2.1. Medidas de imagens de trato vocal (mm)........................................... 25
4.1.3. Procedimentos de edição e análise dos dados acústicos..................... 28
4.1.4. Análise estatística (software XLStat- Addinsoft)................................... 28
4.2. Experimento 2- Análise acústica de emissões em voz cantada
(produzidas por meio de instruções baseadas em metáforas) por cantoras e
não cantoras....................................................................................................
30
4.2.1. Procedimentos de coleta de amostras de áudio durante a emissão de
voz cantada produzida por meio de instruções baseadas em metáforas por
cantoras e não cantoras...................................................................................
31
4.2.2. Procedimentos de edição e análise dos dados acústicos..................... 34
4.2.3. Análise estatística.................................................................................. 35
5. RESULTADOS................................................................................................... 40
5.1. Experimento 1- Análise integrada de dados acústicos e de imagem do
trato vocal: um estudo de caso........................................................................
40
xx
5.2. Experimento 2- Análise acústica de emissões em voz cantada
(produzidas por meio de instruções baseadas em metáforas) por cantoras e
não cantoras....................................................................................................
61
5.2.1. Medidas acústicas extraídas pelo script ExpressionEvaluator e de
frequências formânticas (F1, F2 e F3)............................................................
61
5.2.2. Dados de prontidão extraídos pelo script ExpressionEvaluator............ 73
6. DISCUSSÃO...................................................................................................... 77
6.1. Experimento 1- Análise integrada de dados acústicos e de imagem do
trato vocal: um estudo de caso ......................................................................
77
6.2. Experimento 2- Análise acústica de emissões em voz cantada
(produzidas por meio de instruções baseadas em metáforas) por cantoras e
não cantoras ..................................................................................................
88
6.3. Abordagem integrada- experimentos 1 e 2.............................................. 95
7. CONCLUSÃO...................................................................................................... 101
8. Anexos............................................................................................................... 102
9. Referências Bibliográficas.................................................................................. 137
1
1. INTRODUÇÃO
Os aspectos da voz cantada fascinam os mais diversos grupos de
pesquisadores, justamente pelo uso altamente diferenciado e refinado de estruturas
dos aparelhos respiratório e digestivo que no dia-a-dia também desempenham as
funções de fala.
Diante deste fascínio, o projeto complementa-se a atividades desenvolvidas
anteriormente em plano de pesquisa de iniciação cientifica, em que abordou questões
da correspondência entre os planos da percepção e da acústica da voz falada (ALVES,
CAMARGO, 2006).
Neste contexto da voz cantada, a qualidade vocal ganha destaque, no momento
em que o cantor ajusta seu aparelho fonador na busca por atingir diferentes qualidades
sonoras. As variadas escolas de canto trabalham com técnicas igualmente distintas, a
fim de propiciar ao cantor a vivência do controle do aparelho fonador em seus níveis
respiratório, fonatório, articulatório e ressonantal. Tal nível de controle permite ao
cantor, inclusive àqueles que iniciam as aulas de canto, alcançar e experienciar as
qualidades sonoras compatíveis com o repertório desejado.
Da mesma forma que se admite que toda manifestação de fala é expressiva
(MADUREIRA, 2005), o mesmo valeria para as manifestações da voz cantada. A
construção da expressividade pauta-se na combinação de elementos prosódicos (ritmo,
entoação, qualidade vocal, entre outros) a elementos segmentais (vogais e
consoantes), mediadas pelas relações entre o som e o sentido (MADUREIRA, 2005).
No que se refere ao enfoque das relações entre som e sentido, podemos
apontar as metáforas como representações simbólicas (HINTON et al, 1994), dotadas
de sensações proprioceptivas, motoras e táteis (FONAGY, 2000). Tais estudos são
2
baseados em modelos de descrição fonética, com base em descrições perceptivas,
acústicas e fisiológicas, no campo das Ciências Fonéticas.
Os estudos de voz cantada apontam que as metáforas, incorporadas
inicialmente pelos professores de canto com sua base na prática de ensino, revelaram-
se, gradativamente, como recursos tanto para facilitar a memorização de sensações
físicas (ROSSBACH, 2011), quanto para auxiliar a criação de correlações entre o
simbólico e o fisiológico (SOUSA et al, 2010).
Dessa forma, no universo do ensino do canto, as metáforas foram incorporadas
enquanto estratégia para levar o aluno/cantor a vivenciar ajustes no trato vocal e
sensações promovidas, uma vez que, para vários destes alunos/cantores as instruções
baseadas somente na ação de grupos musculares, portanto na fisiologia da voz
cantada, seriam de difícil compreensão, bem como de execução (SOUSA et al, 2010).
No caso do canto lírico, cantores experientes e reconhecidos produzem
qualidades sonoras de forma a que possam ser ouvidos em salas de concerto de
dimensões consideráveis, simultaneamente ao som da orquestra, sem o uso de
qualquer sistema de amplificação (SUNDBERG, 1997). Diante desta situação, a
indagação frequente dos pesquisadores reside na origem de tal habilidade: seria
apenas questão de prática da técnica de canto? Ou existiria algo de especial no “órgão
voca1 de tais cantores?
O professor de canto, por sua vez, busca por estratégias que possam
desencadear os ajustes de trato vocal (entendidos do ponto de vista fonético como
tendências musculares recorrentes na produção vocal), os quais envolvem ações da
musculatura respiratória, daquela da região laríngea (ajustes fonatórios) e da região
1 A partir deste ponto do texto, o termo “órgão vocal” referido em textos da voz cantada será referido
como trato vocal. Nas descrições acústicas, o trato vocal engloba a região compreendida no circuito acústico desde pregas vocais até lábios (FANT, 1960), destacando o segmento do “órgão vocal” em que ocorre o processo de produção e modificação/modelagem do som vocal.
3
supraglótica (ajustes articulatórios), além dos níveis gerais de tensão muscular (ajustes
de tensão muscular) na concepção do modelo fonético de descrição da qualidade vocal
(LAVER, 1980).
No que se refere à abordagem do plano dos ajustes articulatórios, é comum a
prática de instrução vocal por meio de metáforas, as quais buscam estimular o aluno a
vivenciar diferenciados mecanismos que resultem em qualidades vocais específicas
(CLEMENTS, 2008; SOUSA et al, 2010).
As Ciências Fonéticas e, particularmente, a Fonética Acústica, têm se dedicado
ao estudo dos variados efeitos sonoros que o aparelho fonador humano pode produzir
ao modular a corrente de ar expiratória, tanto para finalidades de produção da emissão
da voz falada, quanto cantada (KENT, 1993; SUNDBERG, 1997).
Os estudos no campo da voz cantada, de modo geral, descrevem os aspectos
de dinâmicas da voz, todavia, de acordo com a literatura das ciências vocais, a
investigação pormenorizada de correlatos acústicos e fisiológicos da qualidade vocal
no canto é ainda escassa. A produção científica concentra-se em detalhamento de
correspondências entre as esferas perceptiva e acústica (FUKS, 1999; MEDEIROS,
2002; VIEIRA, 2004; BEZERRA et al, 2008; PEREIRA, 2008; REHDER, BEHLAU,
2008; ULLOA, 2009; MOTA et al, 2010), perceptiva e fisiológica (DUPRAT et al 2000)
e finalmente, perceptiva, acústica e fisiológica (MILLER, SCHUTTE, 1990; ZAMPIERI
et al, 2002; HANAYAMA, 2003; SALOMÃO, 2008; HANAYAMA et al, 2009; GUSMÃO
et al, 2010).
Outro aspecto importante neste campo de pesquisas pode ser registrado por
descrições de eventos mais frequentes para a voz feminina: sintonia F1-F0 e
masculina: formante do cantor (SUNDBERG, 1974; SUNDBERG, 1979; VIEIRA, 2004;
GUSMÃO et al, 2010).
4
O presente estudo apresenta como enfoque a técnica das metáforas utilizadas
como instruções para o canto, a fim de se investigar de que forma as instruções
direcionadas pelo professor de canto, enquanto metáforas para se ajustar o ”órgão
vocal” podem influenciar a qualidade sonora final produzida. Para tanto, o estudo
apresenta a proposta de investigação da atividade do trato vocal por meios acústico e
articulatório (imagem do trato vocal, mais especificamente de imagens
videofluoroscópicas), os quais permitem especialmente detalhar os ajustes de
qualidade vocal, bem como alguns elementos de dinâmica vocal.
Segundo Medeiros (2002), existem diferenças entre a fala e o canto,
principalmente no que diz respeito à inteligibilidade durante a produção do texto
cantado e às modificações formânticas. Tais achados reforçam a demanda por enfoque
de estratégias que visem estimular ao aluno/cantor a implementar tais diferenciações
em suas produções de voz cantada.
Do ponto de vista de estudos com imagem do trato vocal, registraram-se,
inicialmente, técnicas aplicadas à produção de fala, como as técnicas radiográficas
(LINDBLOM, SUNDBERG, 1971; MACHADO, 1993), xerorradiografia (PINHO et al,
1988; MASTER et al 1991), tomografia computadorizada (SUNDBERG et al, 1987;
THOMÉ, 1999; PASSEROTTI et al, 2008), ressonância magnética (GREGIO, 2006;
VENTURA et al, 2010), ultrassonagrafia (SVICERO, 2012) e videofluoroscopia
(MANGILLI et al, 2008). Tais técnicas foram gradativamente incorporadas ao estudo do
canto, como radiografia (ROERS et al, 2009), ressonância magnética (ECHTERNACH
et al, 2008; SUNDBERG, 2008) e videofluoroscopia (SOUZA, 2008; TAVANO, 2011;
DRAHAN et al, 2012).
A abordagem da qualidade vocal a partir da motivação fonética (LAVER, 1980)
inspirou a concepção de roteiro para avaliação da qualidade vocal falada- roteiro Vocal
5
Profile Analysis Scheme - VPAS (LAVER et al, 1981; LAVER, 1982; LAVER, 2000;
MACKENZIE-BECK, 2005), entretanto os conceitos de mecanismos intrínsecos e
extrínsecos de qualidade vocal são válidos para as situações de fala e canto, no
sentido de que os efeitos sonoros podem emergir de condições anátomo-fisiológicas do
aparelho vocal (intrínsecas) ou por demandas por variações de seu funcionamento em
termos do contexto e dos efeitos sonoros (extrínsecas ou fonéticas). No canto, a
interação entre tais aspectos não pode ser considerada menos importante e a busca
por entender as mobilizações de longo termo, que se refletem em qualidades sonoras
específicas, é ainda um tópico a ser cuidadosamente estudado.
Diante do exposto, este estudo enfoca a possibilidade de correlação da
caracterização fisiológica (articulatória), propiciada pela análise de imagens
videofluoroscópicas dos ajustes do trato vocal à esfera acústica em emissões de voz
cantada, em atividades que envolvam as instruções baseadas em metáforas fornecidas
com a finalidade de atingir qualidades sonoras decorrentes de mobilizações dos
articuladores nas mulheres de dois grupos: cantoras e não cantoras.
Essa pesquisa foi desenvolvida com base em dois experimentos. O primeiro
refere-se a um estudo de caso, pautado na análise vocal acústica e de imagem do trato
vocal por meio da videofluoroscopia e o segundo baseia-se em um estudo de análise
vocal acústica com base nas emissões de um grupo de cantoras e um grupo de não
cantoras.
A análise acústica foi incorporada como recurso instrumental, principalmente no
que diz respeito à possibilidade de maior detalhamento da relação entre percepção e
da produção dos sons pelo trato vocal (CAMARGO, MADUREIRA, 2004; ALVES,
CAMARGO, 2006; PESSOA et al 2011).
6
Para o canto, utilizam-se as mesmas estruturas do trato vocal durante a fala,
porém com diferentes mobilizações de acordo com as necessidades da produção da
voz cantada (PEDROSO, 1997). A emissão da voz cantada requer adaptações de
pressão subglótica, de ajustes laríngeos e do trato vocal, visando uma produção
estética, agradável e livre de mecanismos que possa gerar esforço vocal (SUNDBERG,
1990).
Os aspectos expressivos da voz cantada podem ser também detalhados por
meio da análise acústica e de parâmetros correlatos, tais como a prontidão (PEREIRA,
2000; BARBOSA, 2009). As diferentes emoções e atitudes expressas na emissão
vocal refletem-se em mudanças na qualidade vocal, bem como modificações nos
contornos de ênfases e entonações (SCHERER, BANZIGER, 2003). Dessa forma, a
inspeção acústica de elementos prosódicos viabiliza a identificação de atitudes e
emoções, tanto para a fala quanto para o canto (JOHNSTONE et al 1995; BARBOSA,
2009).
Neste contexto, os questionamentos que nortearam a proposição da presente
pesquisa referem-se a: o uso das metáforas para o ensino do canto propicia
mobilizações diferenciadas do trato vocal na produção vocal? Tais mobilizações são
detectáveis por meio de descrições fisiológicas e acústicas da qualidade vocal? Tais
mobilizações seriam detectadas em cantores e não cantores? A análise de imagem do
trato vocal permite a associação a medidas acústicas, tais como frequências
formânticas?
Este projeto focaliza a avaliação fisiológica (articulatória) e acústica no campo da
voz cantada, tendo como fundamentação a Fonética Acústica e Articulatória. Estudo
desta natureza permite o detalhamento do refinamento de ações sob as quais o trato
7
vocal é submetido nas situações de canto e pode colaborar para a compreensão de
particularidades do processo de ensino e prática do canto.
Dessa forma, tais achados tornam possível inferir sobre os níveis de mobilização
das estruturas do trato vocal diante do estímulo das metáforas, o que futuramente
poderia auxiliar outras categorias de profissionais da voz que também demandam um
uso altamente refinado do trato vocal, bem como auxiliar a discussão em torno das
relações entre som e sentido e, finalmente, do ensino de canto em nosso meio.
8
2. OBJETIVO
Este trabalho tem por objetivo investigar, em amostras de voz cantada, os
efeitos do uso das metáforas, a partir de descrições acústicas e articulatórias (imagens
do trato vocal) de qualidade vocal em mulheres cantoras e não cantoras.
9
3. REVISÃO DE LITERATURA
A revisão de literatura foi dividida nos seguintes tópicos: a voz cantada e as
instruções no canto baseadas em metáforas; análise acústica e articulatória da voz
cantada e análise de imagens do trato vocal.
3.1 . A voz cantada e as instruções no canto baseadas em metáforas
A origem do canto e da fala se confundem e ambas estão relacionadas à
necessidade de externalizar afeto e, portanto, carregam marcas fortes de emoção
(SALOMÃO, 2008). Durante o canto, quando há harmonia entre os aspectos
explorados, é possível gerar diferentes sensações positivas no ouvinte, bem como
inúmeras emoções durante sua interpretação (ANDRADA E SILVA, DUPRAT, 2004).
Segundo Aguiar (2007), a ópera surgiu no início do século XVI pela idéia de unir
poesia, drama e música, ou seja, os poetas e músicos italianos buscavam reviver a
tragédia grega.
Em seguida, surgiu a escola de canto italiana conhecida como Bel Canto que,
em seu início, era praticado somente por homens e era caracterizada pela “sustentação
e equalização do som na transição de uma frase musical para a frase musical seguinte,
sem qualquer interrupção perceptível”. Portanto, o “Bel Canto tornou-se uma aliança
entre a técnica vocal e a beleza da composição” (AGUIAR, 2007, p.13), todavia, sofreu
mudanças ao longo dos anos.
No canto lírico, existe uma ampla terminologia para a descrição da qualidade
vocal. Muitos dos termos técnicos são utilizados pelos especialistas em voz, enquanto
10
outros são considerados metafóricos ou estéticos (HENRICH et al, 2007). Entretanto, a
terminologia e a forma de cantar não são unânimes (TRAVASSOS, 2008).
Segundo Clements (2008), existem três tipos de métodos utilizados pelos
professores de canto. O primeiro é embasado exclusivamente na anatomia e nos
estudos científicos. O segundo utiliza-se de analogias e de imagens para realizar o
aprendizado, tendo sido bastante utilizado em Portugal em meados do século XX,
como ensino tradicional para o aprendizado (AGUIAR, 2007). Por fim, o método que
combina ambos os métodos supracitados, isto é, alia o ensino tradicional ao ensino
científico (AGUIAR, 2007).
Para Clements (2008), o terceiro método seria o que resultaria em melhores
resultados de aprendizado, enquanto para Aguiar (2007) permitiria utilizar o aparelho
fonador de maneira harmônica e estimularia um aprendizado global e estruturado.
As metáforas também conhecidas como “imagens” no meio musical são
utilizadas pelos professores de canto na abordagem de técnicas vocais (SOUSA et al,
2010). O uso da metáfora no ensino do canto é recomendado enquanto recurso para
memorização de sensações físicas, facilitador da compreensão do aluno em relação à
técnica empregada e aos conceitos tidos como abstratos (CLEMENTS, 2008;
ROSSBACH, 2011).
Pesquisa sobre o uso das metáforas como estratégia pedagógica no ensino do
canto revelou que grande parte dos professores de canto utilizam tais “imagens” com o
objetivo de estimular a propriocepção dos alunos, bem como de tornar palpável o
ensino das técnicas, por considerarem que estratégias fundamentados na fisiologia
seriam de difícil compreensão (SOUSA et al, 2010).
Na mesma pesquisa, algumas das metáforas utilizadas pelos professores de
canto entrevistados foram: “ressonância como uma lâmpada”, “cúpula de uma igreja
11
dentro da boca”, “ressonância como uma bolha de sabão”, “bocejo”, “sentir o perfume
de uma flor”, “ressonância como um capacete”, “cantar em uma caverna”, “voz como
gota de orvalho”, “voz como um sino”, “voz como uma equipe de corredores de
revezamento”, “extensão vocal como um armário com muitas gavetas”, “cantar como se
fala”, “cantar como se diz um texto”, “vogais mais claras ou mais escuras”, “cantar
refazendo o caminho do ar”, “focar a voz”, “postura de admiração”, “risada de bruxa” e
“som frontal”. A metáfora “cantar como se fala” foi a mais citada entre os professores
do canto erudito, por diminuir a tensão durante a articulação do texto (SOUSA et al,
2010).
Grande parte dos professores de canto refere que as metáforas geram efeitos
positivos na “musicalidade do aluno e que podem auxiliar no desenvolvimento da
impostação vocal, variações de timbre, extensão vocal, afinação, inteligibilidade e
homogeneidade da voz, fraseado, dinâmica, flexibilidade da voz e intenção
interpretativa” (SOUSA et al, 2010, p. 323). Além disso, apontam que nem sempre uma
mesma metáfora pode gerar bons resultados, em alguns casos, há necessidade de
modificar ou adaptar o tipo de metáfora para cada aluno.
Rossbach (2011) utilizou as metáforas como instrumento didático tanto para
cantores, quanto para não profissionais, associadas a gestos corporais, em coros
comunitários. Apontou que, muitas vezes, os professores de canto utilizam esse
recurso sem conhecimento aprofundado de seus mecanismos e de seus efeitos.
De acordo com o dicionário Aulete (2007), o termo metáfora refere-se a uma
“figura de linguagem que consiste em estabelecer uma analogia de significados entre
duas palavras ou expressões, empregando uma pela outra”. Pensar na metáfora
somente como substituição torna seu significado muito restrito.
12
Na representação simbólica, um órgão do trato vocal pode representar um outro
órgão do corpo, um objeto ou uma condição de proximidade, distância, entre outras,
dando origem às metáforas sonoras (MADUREIRA, 2005), cujo conceito é fundamental
ao enfoque do simbolismo sonoro (HINTON et al, 1994). As metáforas carregam
sensações proprioceptivas, motoras e táteis (FONAGY, 2000).
As relações entre som e sentido pautam-se em cinco categorias de simbolismo;
(HINTON et al, 1994): corporal (sons que expressam estados físicos e emocionais do
falante, incluindo sons involuntários como tosse, soluço), imitativo (relacionado a
palavras e frases que representam sons ambientais); sinestésico, (vogais, consoantes,
elementos prosódicos e parâmetros acústicos são usados para representar
propriedades visuais, táteis e proprioceptivas de objetos), metalinguístico (abrange
escolhas de segmentos e padrões entoacionais para sinalizar aspectos de estrutura e
função linguística) e convencional (associação entre certas vogais e consoantes a
certos significados).
No campo do simbolismo sonoro, para respaldar as relações entre som e
sentido, também figuram conceitos importantes como o código de frequência (OHALA,
1997), relacionado à frequência fundamental (f0), código de esforço, relacionado à
articulação e o código de produção, relacionado à pressão subglótica
(GUSSENHOVEN, 2004).
A rigidez ou flexibilidade da voz humana são atribuídas, em grande parte, ao
mecanismo de funcionamento das pregas vocais, sendo referidos como mecanismos
laríngeos intrínsecos: alongamento, encurtamento, adução e abdução, aliados a
variados graus de tensão (entre os extremos hiper e hipofuncional) (HIRANO, 1988;
PINHO, 1998). Em alguns casos, cantores inexperientes buscam superar suas
dificuldades em termos de projeção, brilho na voz e suporte respiratório, de maneira
13
que podem acarretar tensões musculares, enquanto que cantores experientes são
capazes de projetar sua voz sem auxílio de microfone, sem realizar ajustes e abusos
vocais que possam prejudicar as estruturas de seu trato vocal, especialmente as
pregas vocais (SUNDBERG, 1970; SUNDBERG, ASKENFELT, 1983; SUNDBERG,
1987; CORDEIRO et al, 2007).
O canto lírico feminino requer sons mais agudos. Na fala feminina, o valor médio
da frequência fundamental (f0) situa-se em torno de 220 Hz. Em emissão cantada, uma
soprano pode atingir f0 de 1024 Hz (VIEIRA, 2004). Muitas vezes, mulheres utilizam
frequências fundamentais mais elevadas durante o canto, quando comparadas ao valor
da frequência do primeiro formante (F1). Tal efeito ocorre especialmente em mulheres
e é conhecido como sintonia F1-F0 (SUNDBERG, 1979; CARLSSON, SUNDBERG,
1992; SUNDBERG, SKOOG, 1997; SUNDBERG, 2003; VIEIRA, 2004).
Diante de tais avanços, na descrição do refinamento dos ajustes de qualidade
vocal no canto, o professor de canto depara-se com a demanda de estimular o aluno a
buscar tanto pelas potencialidades intrínsecas ao trato vocal do aluno, quanto ao
aprimoramento da técnica vocal (condições extrínsecas), uma vez que a prática vocal
pode colaborar para estabilizar ajustes que são reconhecidos nos cantores tidos como
experientes. Há inclusive a indagação quanto ao fato de alguns ajustes, ou
“ornamentos” vocais, serem apenas possíveis com muitos anos de prática vocal e
emergirem como efeitos de vozes experientes e altamente treinadas, tal como o vibrato
vocal (SUNDBERG, 1987; ZAMPIERI et al, 2002; VIEIRA, 2004; BEZERRA et al,
2008).
14
3.2. Análise acústica e articulatória da voz cantada
Esta dissertação pauta-se em estudos da fonética acústica (análise da produção
vocal no canto) e da fonética articulatória (imagens do trato vocal).
Fant (1960) descreveu o modelo fonte-filtro para a produção das vogais, o qual
auxilia na compreensão dos ajustes utilizados em sua produção, com base em
descrições acústico-articulatórias. Neste modelo, a fonte seria caracterizada pelas
consequências acústicas da atividade vibratória das pregas vocais. O filtro estaria
relacionado às consequências acústicas dos ajustes supraglóticos, caracterizadas por
um conjunto de picos de frequência, também conhecidos como formantes. Sendo
assim, as configurações do trato vocal influenciariam as frequências naturais de
ressonância do trato vocal supraglótico (FANT, 1960; SUNDBERG, 1979; KENT, 1993).
No caso das vogais, a extensão total e o diâmetro das cavidades do trato vocal
influenciam, acusticamente, as frequências naturais de ressonância e, portanto, a
qualidade sonora final das vogais (FANT, 1960; SUNDBERG, 1970; LIEBERMAN,
BLUMSTEIN, 1988; KENT, 1993).
Portanto, as vogais podem ser diferenciadas acusticamente pela análise da
frequência dos três primeiros formantes, referidos como F1, F2, F3 ... Fn. Quanto à
identificação fonética das vogais, embora exista quantidade infinita de formantes, os
três primeiros são os mais importantes para conferir a sua identidade fonética,
especialmente a combinação entre F1 e F2 (FANT, 1960; KENT, READ, 1992; KENT,
1993).
Neste contexto, F1 relaciona-se à altura de língua e à abertura de mandíbula,
enquanto F2 relaciona-se a variações da postura de língua no eixo ântero-posterior. F3,
por sua vez, relaciona-se à passagem da constrição (FANT, 1960; KENT, 1993;
15
MEDEIROS, 2002). Portanto, vogais altas apresentam baixos valores de F1 e vogais
baixas altos valores de F1. Para F2, vogais anteriores apresentam maiores valores de
F2 enquanto que vogais posteriores apresentam menores valores (FANT, 1960; KENT,
1993; MEDEIROS, 2002).
As características articulatórias da produção das vogais, por sua vez, referem-se
à vibração periódica de pregas vocais, passagem da corrente de ar livre pelo trato (sem
obstrução imposta pelos articuladores), posicionamento do dorso da língua nos planos
vertical (alta, média-alta, média-baixa e baixa) e horizontal (anterior, central ou
posterior), arredondamento labial (arredondada ou não arredondada) e posição do
palato mole (oral ou nasal) (LAVER, 1994).
A frequência fundamental (f0), por sua vez, é determinada pelo número de ciclos
que as pregas vocais realizam num intervalo de tempo, por exemplo, por segundo. Os
fatores que determinam a frequência habitual e sua variação (extensão vocal e gama
tonal) são representados por: comprimento natural das pregas vocais, alongamento,
massa em vibração e tensão envolvida (HIRANO, 1988; PINHO, 1998; MCALLISTER
et al, 2000; ARAÚJO et al, 2002; FELIPPE et al, 2006; JOTZ et al, 2006).
De acordo com o estudo comparativo da voz falada e cantada, Medeiros (2002)
aponta que há prolongamento das vogais durante a emissão da voz cantada e que a
manutenção de sua frequência fundamental está relacionada a manobras articulatórias
(abaixamento de mandíbula e menor volume de língua). A autora ainda relata a
aproximação dos valores de F1 com a frequência fundamental; à semelhança de dados
de Sundberg (1979), Carlsson e Sundberg (1992) e Sundberg e Skoog (1997).
O espectro de longo termo (LTAS) é considerado eficiente para análise vocal,
com ele é possível observar atividade laríngea e características formânticas
16
(NORDENBERG, SUNDBERG, 2004). Além disso, é possível diferenciar gênero, idade
tanto em voz falada quanto na voz cantada (MASTER et al, 2006).
Zampieri et al (2002), na continuidade de estudos comparativos entre fala e
canto, pesquisaram, em cantores populares durante a produção/ imitação do canto
lírico, os ajustes laríngeos por meio da técnica de nasofibrolaringoscopia e realizaram
as análises perceptivo-auditiva e acústica das emissões. Quanto à análise perceptivo-
auditiva, relataram que durante a imitação do canto lírico houve modificação de
qualidade vocal, aumento de loudness, maior projeção vocal e sobrearticulação das
palavras. Em relação à análise acústica, houve redução dos valores de jitter e shimmer
nas vogais na produção cantada comparada à emissão falada. O ajuste laríngeo mais
evidente foi a constrição laríngea, em padrões ântero-posterior e mediano.
Salomão (2008) apontou que os aspectos acústicos, fisiológicos
(eletroglotografia) e aerodinâmicos interferem na diferenciação perceptiva dos registros
vocais. Durante a produção dos registros modal e falsete, encontrou maiores valores
do quociente fechado e menores valores de quociente da amplitude normalizada e de
H1-H2, sugerindo que a interação entre eles propicia diferentes características dos
ajustes laríngeos e, por sua vez, conferem as características perceptivas aos registros
produzidos.
3.3. Análise de imagens do trato vocal
Os estudos de imagens do trato vocal durante a produção vocal são ainda
escassos, apesar de permitirem uma detalhada descrição complementar dos vários
níveis de atividade do trato vocal durante a emissão vocal.
17
Alguns estudos têm utilizado as imagens videofluoroscópicas para descrever
mudanças fisiológicas durante as situações de fala ou canto (GONÇALVES, 2002;
NUÑES, 2006; SOUZA, 2008; DRAHAN et al, 2012).
Enquanto técnica de diagnóstico por imagem, a videofluoroscopia é um método
que registra os eventos biológicos dinâmicos, gerados pela exposição de pacientes a
baixos índices de radiação como fonte de imagens. Além disso, tais registros podem
ser gravados e permitem traçar estimativas em tempo, dimensão e velocidade reais
dos eventos observados, tais como a dinâmica da deglutição, da fala e canto (FIRMAN
et al, 2000; COSTA et al, 2003).
Segundo Lopasso (2000), a videofluoroscopia agrega a medidas bidimensionais,
modelos em que a densidade serve de parâmetro para a estimativa da avaliação por
imagem em terceira dimensão. Tal modelagem permite a obtenção de valores
volumétricos em áreas de interesse de estudo. A videofluoroscopia pode proporcionar
subsídios importantes para a avaliação detalhada dos articuladores (lábios, língua,
palato duro, palato mole) e cavidades ressoadoras (labial, oral, faríngea e nasal)
durante a emissão da voz cantada.
A radiação liberada pela videofluoroscopia pode ser 80% menor que o exame de
raio-X convencional, pois esta quantidade de exposição está vinculada ao tempo de
exposição do sujeito à radiação, que determina a qualidade final da imagem resultante
(MOSCA, MOSCA, 1971).
A técnica possibilita a análise das estruturas do trato vocal por meio de gravação
de imagens dinâmicas, de forma a permitir, rever e discutir seus dados e resultados
com outros profissionais/especialistas utilizando recursos tecnológicos e sem a
necessidade de manter o sujeito ou paciente exposto à radiação por mais tempo
(BILTON, LEDERMAN, 1998).
18
De modo geral, a videofluoroscopia é rotineiramente um exame utilizado nas
avaliações dos distúrbios da deglutição (disfagia), em que se busca correlacionar os
achados das avaliações clínicas aos dados obtidos a partir do estudo dinâmico da
deglutição, com detalhamento das ações em cavidade oral, orofaringe, hipofaringe e
esôfago superior (LEVY et al, 2004). Com exceção da última, as demais áreas
descritas, e envolvidas no processo de deglutição, participam da ação do trato vocal
supraglótico na definição dos ajustes articulatórios da qualidade vocal falada e cantada.
Gonçalves (2002) pesquisou as sílabas [pa] e [sa] por meio da videofluoroscopia
e realizou análise perceptivo-auditiva nas emissões de sujeitos com e sem fissuras
labiopalatinas. Apontou que mesmo profissionais experientes podem apresentar
dificuldades para identificar quais são os distúrbios articulatórios compensatórios
realizados pelos sujeitos e que não houve registro de deslocamento posterior da língua
nas sílabas estudadas (conforme apontaria a literatura), mesmo com a presença de
fístula no palato ou alterações de oclusão dentária.
Drahan et al (2012) apresentou como objetivo estudar a posição da laringe
durante o repouso e no canto de cantoras profissionais e não profissionais com
utilização da técnica de videofluoroscopia. A medida utilizada refere-se à distância
longitudinal entre pregas vocais e palato duro e tais medidas foram extraídas em
milímetros com o auxilio de um software de análise de imagens. Concluiu que as
cantoras profissionais apresentam maior distância entre pregas vocais e palato duro
durante o canto em comparação ao repouso, mostrando maior domínio dos ajustes da
musculatura extrínseca da laringe, quando comparadas aos dados das cantoras não
profissionais, para as quais não foram detectadas mobilizações dessa natureza.
Em estudo da configuração do trato vocal por meio da videofluoroscopia de
emissões do canto popular, Nuñes (2006) destacou que os ajustes do canto
19
diferenciaram-se daqueles da fala em termos da manutenção da estabilidade de laringe
e à conformação da cavidade faríngea (expansão), à movimentação de véu palatino
(lentificada) e à mandíbula (maior movimento vertical).
Souza (2008) investigou ajustes do trato vocal e do músculo diafragma no canto
lírico por meio da análise videofluoroscópica, laringológica e perceptivo-auditiva.
Concluiu que no apoio abdominal expandido há predomínio de ajustes de laringe baixa,
expansão faríngea (maior distância entre raiz de língua e parede posterior de faringe) e
maior movimentação vertical da mandíbula. Para a emissão com apoio abdominal, a
laringe situou-se próxima à posição de repouso, a cavidade faríngea apresentou menor
área e as pregas vocais econtraram-se em adução completa. O estudo reforçou a
validade de estudos de imagem para identificar e mensurar modificações de respiração
e trato vocal durante o canto.
Softwares para medição de imagens foram aplicados a estudos de imagens de
radiografia e ressonância magnética de canto (ERICSDOTTER et al, 1998;
ECHTERNACH et al, 2008; SUNDBERG, 2008). Atualmente, encontra-se disponível
software de livre acesso para análise de imagens do corpo humano (imagens médicas)
(Osíris- http://www.sim.hvuge.ch/osiris/01_Osiris_Presentation_EN.htm).
Em relação ao estudo de Sundberg (2008) com o uso da técnica de ressonância
magnética, e utilização do software de análise de imagem Osiris, foi possível observar
modificações no trato vocal em relação à abertura de lábios e mandíbula e diferentes
posturas de língua.
Echternach et al (2008) também estudou o trato vocal de uma cantora por meio
da análise de imagem pela técnica de ressonância magnética. Os achados indicam que
durante a produção de voz cantada há abertura de lábios e de mandíbula, elevação do
dorso da língua e expansão faríngea.
20
Ericsdotter et al (1998) realizou um estudo para testar a viabilidade da utilização
de um software desenvolvido em sua própria Universidade (KTH- Royal Institute of
Technology) em um cantor (sexo masculino) submetido a técnica de imagens
radiográficas. Foi possível extrair as medidas do trato vocal (em emissões baseadas
em interpretações articulatórias das variantes do Sueco), bem como possibilitou suas
correspondências e extrair as medidas acústicas de frequências formânticas.
Atualmente, vale ressaltar que a técnica da ultrassonografia também tem sido
utilizada para estudos de imagem do trato vocal, principalmente em relação aos
contornos de dorso de língua (SVICERO, 2012).
21
4. METODOLOGIA
Este tópico está estruturado em dois experimentos, denominados experimentos
1 e 2, respectivamente relativos à análise integrada de imagem do trato vocal e de
dados acústicos (estudo de caso) e à análise acústica de emissões por cantoras e não
cantoras. Em ambos os experimentos, as emissões estudadas referiram-se à voz
cantada produzida por meio de intruções baseadas em metáforas.
Conforme preceitos éticos, os sujeitos participantes da pesquisa foram
informados sobre os procedimentos e objetivos da pesquisa, de modo a expressarem
consentimento no uso das informações obtidas para fins científicos e inclusão dos
dados em banco de dados para pesquisa. O Termo de Consentimento Livre e
Esclarecido- TCLE para cada um dos experimentos é apresentado nos anexos 1 e 2.
Este estudo foi submetido ao Comitê de Ética e Pesquisa da PUCSP e aprovado sob o
número 459/2011 (Anexo 3).
4.1. Experimento 1- Análise integrada de dados acústicos e de imagem do
trato vocal: um estudo de caso
Neste experimento, são relatados os procedimentos relativos à coleta e à análise
de dados realizada com a participação de um sujeito do sexo femininio, de 26 anos de
idade, não cantora. Os critérios de inclusão para seleção referiram-se ao sexo e à faixa
etária, bem como à manifestação de interesse em colaborar com a sessão de coleta de
imagens. Os critérios de exclusão compreenderam a auto-referência de queixas vocais
e de quadros inflamatórios/ infecciosos de vias aéreas no momento da coleta, bem
como de diagnóstico otorrinolaringológico e fonoaudiológico de alteração vocal no
período. Além disso, foram considerados critérios de exclusão aqueles referentes às
22
contraindicações para a realização de exames de imagem desta natureza: ter realizado
esse exame recentemente, mais especificamente, no período de seis meses; e, no
caso de mulheres, encontrar-se em período gestacional2.
4.1.1. Procedimentos de coleta de amostras de imagem do trato vocal e de
áudio durante a emissão em voz cantada produzida por meio de instruções
baseadas em metáforas
A coleta de dados foi realizada em uma sessão, no serviço de Radiologia de um
hospital privado da cidade de São Paulo.
Durante a sessão de coleta, o sujeito permaneceu sentado em sala do Serviço
de Radiologia em que se utilizou equipamento Philips, Tele Diagnost-Optimus; LG
monitor, LG DVD-HDD, monitor Philips com sistema de gravador/monitor para registro
em DVD. Antes de se iniciar o procedimento de registro de imagens, foi apresentado ao
sujeito o registro em áudio de um trecho da canção infantil “Sapo Jururu” gravado por
uma professora de canto como referência. Segue a canção abaixo:
Sapo Jururu, da beira do rio,
quando o sapo canta: ó, maninha
é que está com frio.
A mulher do sapo deve estar lá dentro,
fazendo rendinhas, maninha,
para o casamento.
2 Dado o fato de as coletas ocorrerem em ambiente externo ao Laboratório Integrado de Análise Acústica
e Cognição (LIAAC) e a grade horária ser restrita em função da alta demanda do serviço, não foi possível compatibilizar a agenda da informante cantora com aquela disponibilizada para coletas da pesquisa.
23
Para a composição do corpus foram concebidas quatro tarefas:
Tarefa 1: cantar o trecho da canção “Sapo Jururu, da beira do rio. Quando
o sapo canta, ó maninha, é que está com frio” sem o uso de metáfora;
Tarefa 2: cantar o trecho da canção “Sapo Jururu, da beira do rio. Quando
o sapo canta, ó maninha, é que está com frio” com o uso de metáfora
prisma;
Tarefa 3: cantar o trecho da canção “Sapo Jururu, da beira do rio. Quando
o sapo canta, ó maninha, é que está com frio” com o uso de metáfora
catedral;
Tarefa 4: cantar o trecho da canção “Sapo Jururu, da beira do rio. Quando
o sapo canta, ó maninha, é que está com frio” com o uso de metáfora
disco voador.
Para as tarefas 2, 3 e 4 foram utilizadas ilustrações para facilitar a compreensão
das metáforas, de forma a auxiliar o sujeito para a emissão em voz cantada (Anexo 4).
Tais metáforas são comumente utilizadas em pesquisas do grupo de estudos sobre a
fala- LIAAC (CANHETTI, MENEGON, 2012). Todavia, podem ser encontrados ou
podem apresentar as mesmas funções com nomes similares em outros trabalhos que
estudam a metáfora e o canto (SOUSA et al, 2010).
Nos estudos de Sousa et al (2008) encontramos a metáfora “cúpula de uma
igreja dentro da boca”, utilizada nesse estudo como “catedral”; “ressonância como uma
lâmpada”, utilizada nesse estudo como o “prisma” uma vez que existe uma lâmpada
que ao acender ilumina o ambiente ou em relação ao prisma espelha a voz como uma
luz refletida, por fim, “ressonância como uma bolha de sabão”, utilizada nesse estudo
como o “disco voador”, já que ambas rementem a algo que flutua com leveza.
24
O tempo total de exposição à radiação foi de 1 minuto e 46 segundos. Vale
reforçar que durante os intervalos, entre uma emissão e outra, e durante as instruções,
não houve exposição à radiação. Para que o tempo de exposição fosse breve, não
houve solicitação de repetição de tarefas de emissão em voz cantada.
A partir do software de livre acesso Vídeo Converter (versão 2.3 02) os
estímulos em áudio dos vídeos registrados na videofluoroscopia foram extraídos em
formato .wav
4.1.2. Procedimentos de edição e análise dos dados de imagem do trato vocal3
Do ponto de vista de imagens de trato vocal, os registros videofluoroscópicos
foram submetidos a processo de decupagem para análise das mobilizações com o
auxílio do software de livre acesso VirtualDub. Após esse processo, foi possível efetuar
a inspeção prévia do conjunto de movimentos de lábios, língua, palato mole, paredes
de faringe e laringe. Para tanto, as imagens em formato pap foram analisadas por meio
do software Osiris e as medidas de deslocamento de articuladores (lábios, mandíbula e
língua) foram extraídas em milímetros (mm).
O software Osiris aceita somente arquivos com extensão .pap para a utilização
das ferramentas disponibilizadas. A conversão para essa formato será descrita no
anexo 5.
3 Os dados de investigação preliminar deste experimento resultaram em trabalho apresentado no Central
European Conference in Linguistics for Graduate Students (CECILS)– “Acoustic Analysis and vocal tract images”. A partir da apresentação dos dados no evento e em visita a Universidade KTH- Royal Institute of Technology- Departament of Speech, Music and Hearing, foram efetuadas adequações ao projeto, especialmente quanto ao tratamento e extração de medidas de imagens do trato vocal e de medidas acústicas.
25
4.1.2.1.Medidas de imagens de trato vocal (mm)
O conjunto de medidas definido para esta etapa de coleta de dados constou de:
abertura de lábios absoluta; abertura de lábios normalizada; abertura de mandíbula;
distância dorso de língua-faringe; distância dorso de língua-palato. Além disso, foi
definido um elemento qualificador intitulado deslocamento ântero-posterior de língua.
As medidas foram definidas a partir de estudos que utilizaram a técnica de ressonância
magnética para investigações da voz cantada (SUNDBERG, 2008) pelo software Osiris
e outro pela técnica de radiografia (ERICSDOTTER et al, 1998) com o uso do software
APEX-model e são apresentadas abaixo:
o Abertura de lábios absoluta (figura 1): o padrão utilizado para a extração referiu-se à distância demarcada entre dente incisivo central superior e o dente incisivo central inferior
Figura 1. Medida de abertura de lábios
absoluta (mm) gerada pelo software
Osiris
o Abertura de mandíbula (figura 2): o padrão utilizado para extração referiu-se à distância entre o centro da Glabela do osso frontal (parte óssea acima da órbita ocular – na testa) até o mento (queixo).
26
Figura 2. Medida de abertura de
mandíbula (mm) gerada pelo software
Osiris
o Abertura de lábios normalizada (figura 3): o padrão utilizado para extração referiu-se à medida de abertura de mandíbula (figura 2) subtraída do valor da distância entre o dente segundo pré-molar superior e o queixo. Após o resultado dessa subtração, o valor gerado é subtraído do valor de abertura de lábios absoluta (figura 1) (SUNDBERG, 2008).
Figura 3. Medida de abertura de lábios
normalizada (mm) gerada pelo software
Osiris
o Distância dorso de língua-faringe (figura 4): o padrão utilizado para extração referiu-se à distância entre o início de base de língua até a segunda vertebra cervical (ECHTERNACH et al, 2008; SUNDBERG, 2008).
27
Figura 4. Medida da distância de
língua-faringe (mm) gerada pelo
software Osiris
o Distância dorso de língua-palato: o padrão utilizado para extração referiu-se à localização do ponto mais alto de corpo de língua em relação ao palato duro. Em caso de vogais anteriores (figura 5), a medida era realizada no centro do palato duro. Para vogais posteriores (figura 6), a medida apontava o final do palato duro como referência.
Figura 5. Medida da distância de
língua-palato de uma vogal anterior
[Ɛ] (mm) gerada pelo software Osiris
Figura 6. Medida da distância de
língua-palato de uma vogal [a]
posterior (mm) gerada pelo software
Osiris
Elemento qualificador
o Deslocamento ântero-posterior de língua: parâmetro de classificação de julgamento
de deslocamento de dorso de língua em relação a região central do palato duro
(1=anterior) ou região posterior do palato duro (2= posterior).
28
4.1.3. Procedimentos de edição e análise dos dados acústicos
Os estímulos em áudio (extensão .wav) extraídos dos vídeos registrados na
coleta por meio de videofluoroscopia foram submetidos à análise acústica por meio do
software de livre acesso PRAAT- versão 5.1.34.
Tal procedimento garantiu que as amostras em áudio analisadas acusticamente
correspondessem às mesmas emissões das imagens analisadas. As amostras foram
devidamente etiquetadas, destacando-se as vogais /a/ (sApo), /u/ (jurUru), /Ɛ/ (É que),
/i/ (rIo) e /i/ (frIo). Para as vogais selecionadas, foram extraídas as medidas de
frequências formânticas (F1, F2 e F3 em Hz),
Os procedimentos de extração das medidas de frequências formânticas
seguiram as indicações do estudo de Svicero (2012).
O conjunto de dados de imagem do trato vocal e de medidas acústicas foram
inseridos em planilha de dados, especificando-se todas as medidas de imagem do trato
vocal, bem como as medidas acústicas de frequências formânticas (F1, F2 e F3) das
vogais /a/ (sApo), /u/ (jurUru), /Ɛ/ (É que), /i/ (rIo) e /i/ (frIo) inseridas em cada trecho de
emissão com metáfora (prisma, catedral e disco voador) e sem metáfora.
4.1.4. Análise estatística (software XLStat- Addinsoft)
Os achados da análise de imagem do trato vocal e de análise acústica
(frequências formânticas) foram submetidos a tratamento estatístico por meio de
análise multivariada, que permitiu estimar como os ajustes articulatórios do trato vocal,
produzidos por meio de instruções baseadas nas metáforas, refletem-se na qualidade
29
acústica correspondente a tal produção em voz cantada. Os testes realizados e o
conjunto de variáveis analisadas referiram-se a:
o Medidas de imagens do trato vocal e Medidas acústicas (F1, F2 e F3)
Teste de Correlação de Pearson (α= 0,005)
Análise fatorial
Análise aglomerativa hierárquica de cluster
Análise de correlação canônica
Análise de regressão linear
Ancova
Análise discriminante
Medidas de frequências formânticas- metáforas
Medidas de frequências formânticas- vogais
Medidas de imagem do trato vocal- metáforas
Medidas de imagem do trato vocal- vogais
Medidas de frequências formânticas e de imagem do trato
vocal– metáforas
O detalhadamento de cada um dos procedimentos de análise estatística
aplicados encontra-se no Anexo 6.
Os resultados foram analisados quanto à correspondência de dados de imagem
do trato vocal e acústicos para as emissões com e sem metáforas e discutidos com
base na literatura das Ciências Vocais e das Ciências Fonéticas.
30
4.2. Experimento 2- Análise acústica de emissões em voz cantada (produzidas
por meio de instruções baseadas em metáforas) por cantoras e não cantoras
Neste experimento, são relatados os procedimentos relativos à coleta e análise
de dados realizada com a participação de dez (10) sujeitos do sexo femininio, de 19 a
44 anos de idade, divididas igualmente no grupo cantoras e não cantoras (Quadro 1).
Quadro 1. Descrição dos sujeitos participantes da pesquisa
Sujeito Idade Tipo Classificação Vocal
S1 25 Cantora Mezzo-soprano
S2 29 Cantora Soprano
S3 31 Cantora Soprano
S4 44 Cantora Soprano
S5 43 Cantora Mezzo-soprano
S6 28 Não cantora ------
S7 33 Não cantora ------
S8 35 Não cantora ------
S9 19 Não cantora ------
S10 22 Não cantora ------
As particularidades das vozes cantadas masculinas e femininas levaram-nos a
optar pela exploração inicial de um grupo de cantores, uma vez que a inclusão de
sujeitos de ambos os sexos levaria a uma proposta de estudo comparativo, dadas as
particularidades de cada grupo. Além disso, estudos com dados perceptivos e
acústicos de qualidade vocal revelaram a influência do sexo como variável
discriminante para a qualidade vocal estudada pela metodologia acústica adotada no
presente estudo (CAMARGO et al, 2012). Finalmente, a opção pelo sexo feminino
31
também residiu no fato de que o experimento 1 esteve baseado em coleta de amostras
de voz feminina.
De forma geral, os critérios de inclusão referiram-se ao sexo (feminino) e faixa
etária (entre 19 e 45 anos) bem como à manifestação de interesse em colaborar com a
sessão de coleta de audiogravações. Segundo a Organização das Nações Unidas
(ONU) consideram-se adultos jovens sujeitos com até 24 anos e segundo o autor
Eisenstein (2005) considera-se adulto sujeitos com a faixa etária entre 25 a 64 anos.
Os critérios de exclusão centraram-se na auto-referência de queixas vocais e de
quadros inflamatórios/ infecciosos de vias aéreas no momento da coleta, bem como de
diagnóstico otorrinolaringológico e fonoaudiológico de alteração vocal no período.
4.2.1. Procedimentos de coleta de amostras de áudio durante a emissão de
voz cantada produzida por meio de instruções baseadas em metáforas por
cantoras e não cantoras
A coleta de dados foi realizada no Laboratório de Rádio da Faculdade de
Filosofia, Comunicação, Letras e Artes (Faficla) da Pontifícia Universidade Católica de
São Paulo. As instalações do referido laboratório constam com salas com isolamento
acústico, instrumental e suporte técnico para coleta de dados de áudio.
Durante a sessão de coleta, cada sujeito participante permaneceu em pé, com o
uso de microfone de modelo de acoplagem em cabeça Shure WH20, unidirecional.
Antes de se iniciar o procedimento de registro de áudio foi realizado o
procedimento de calibragem da gravação e a instrução sobre a sessão de coleta de
dados.
32
Para o procedimento de calibração foi utilizada uma distância de 15 cm da boca
do sujeito avaliado. O sinal acústico foi identificado pela opção VU meter do software
Soundforge, o ganho da mesa de som foi ajustado para um limite de variação do sinal
acústico de -3 dB a -9 dB. Para registro de amostras foi utilizada a placa de som
Mackie Microseries 1202 VLZ (12 canais), na frequência de amostragem de 22050 Hz,
16 bits de quantização e em formato .wav.
Após esse procedimento, foi posicionado o microfone e o medidor de pressão
sonora (Radio Shack Sound Level Meter catálogo número 33-2055; Radio Shack
Corporation, Forth Worth, TX) a uma distância de 15 cm de um sinal de 1kHz, gerado
pelo software Praat (versão 5.1.34. www.praat.org). O volume desse tom foi
manipulado pela pesquisadora até atingir o nível de 100 dB NPS (ou valor próximo a
esse).
O microfone headset acima referido foi acoplado tanto ao equipamento utilizado
para calibração (decibelímetro) quanto à mesa de som referida.
Para a primeira etapa, foi apresentado ao sujeito participante o registro em áudio
de um trecho da canção infantil “Sapo Jururu” (“Sapo Jururu, da beira do rio, quando o
sapo canta, ó maninha, é que está com frio. A mulher do sapo, é que está lá dentro,
fazendo rendinhas, maninha, para o casamento”) gravado por uma professora de canto
como referência e reproduzido três vezes no sistema de autofalantes da sala de
gravação. Além disso, cada participante recebeu uma versão impressa da letra da
canção.
A gravação teve início com emissão de fala semi-espontânea (nome, data e
breve relato sobre a cidade em que nasceu), permitindo o monitoramento dos níveis de
gravação e a adequação do instrumental. Em seguida, solicitou-se a gravação da vogal
[a] sustentada em níveis de intensidade habitual, forte e fraco.
33
Após estas etapas prévias, deu-se início à coleta de dados de emissões em voz
cantada, de forma a se proceder ao registro das três repetições das tarefas abaixo.
Não foi priorizada a gravação em ordem aleatorizada para que não ocorresse confusão
das instruções baseadas em metáforas por parte do sujeito participante. Dessa forma,
as repetições de cada instrução foram realizadas na sequência:
Tarefa 1: cantar o trecho da canção “Sapo Jururu, da beira do rio, quando
o sapo canta, ó maninha, é que está com frio. A mulher do sapo, é que
está lá dentro, fazendo rendinhas, maninha, para o casamento” sem o uso
de metáfora; Foi solicitado ao sujeito participante que cantasse a canção
da forma mais confortável.
Tarefa 2: cantar o trecho da canção “Sapo Jururu, da beira do rio, quando
o sapo canta, ó maninha, é que está com frio. A mulher do sapo, é que
está lá dentro, fazendo rendinhas, maninha, para o casamento” com o
uso de metáfora prisma. O participante foi instruído “a cantar pensando
em um ponto, um pequeno feixe de luz que se abre e ganha espaço, ou
seja, espalhar a voz como a luz refletida em um prisma”.
Tarefa 3: cantar o trecho da canção “Sapo Jururu, da beira do rio, quando
o sapo canta, ó maninha, é que está com frio. A mulher do sapo, é que
está lá dentro, fazendo rendinhas, maninha, para o casamento” com o
uso de metáfora catedral; O participante foi instruído a cantar “pensando
em projetar sua voz como em uma cúpula de catedral e que deveria
preencher todo esse espaço”.
Tarefa 4: cantar o trecho da canção “Sapo Jururu, da beira do rio, quando
o sapo canta, ó maninha, é que está com frio. A mulher do sapo, é que
está lá dentro, fazendo rendinhas, maninha, para o casamento” com o
34
uso de metáfora disco voador. O participante foi instruído a cantar
“pensando em deixar sua voz flutuar”.
Para as tarefas 2, 3 e 4 foram utilizadas ilustrações para auxiliar a compreensão
das metáforas, de forma a oferecer uma referência ao sujeito para a emissão em voz
cantada (Anexo 4).
O sujeito participante foi instruído quanto ao fato de que poderia interromper e
retomar as emissões, de forma a contemplar a qualidade sonora desejada.
4.2.2. Procedimentos de edição e análise dos dados acústicos
As amostras de áudio registradas em formato estéreo, extensão .wav, 22050 Hz
de frequência de amostragem, foram editadas em estímulo mono e inspecionadas para
checagem do nível de intensidade das emissões. Em seguida, foram etiquetadas em
duas camadas, segundo dois sistemas:
Metáforas- trechos: demarcação de trechos referentes às emissões com
metáforas (prisma, catedral e disco voador) e sem metáforas;
Metáforas- vogais: demarcação da vogal [a] na sílaba tônica da emissão
de sapo (com três ocorrências para cada trecho-metáfora emitido).
Para as edições Metáforas-trechos, os estímulos foram submetidos ao script
ExpressionEvaluator (BARBOSA, 2009), para extração automática de medidas de
prontidão, f0 (mediana, semiamplitude entre quartis, quantil 99,5% e assimetria), de
primeira derivada de f0 (média, desvio padrão e assimetria), intensidade (assimetria),
declínio espectral (média, desvio padrão e assimetria) e LTAS (desvio padrão). Nesta
etapa, todo o enunciado demarcado foi selecionado para extração das medidas
35
acústicas, tomando-se como referência os parâmetros de voz feminina. A descrição de
cada medida encontra-se no anexo 7.
O termo de consentimento para uso do script ExpressionEvaluator encontra-se
no Anexo 8.
Das edições Metáforas-vogais, foram extraídas as medidas de frequências
formânticas (F1, F2 e F3- Hz) das vogais [a] etiquetadas, seguindo-se os
procedimentos relatados no estudo de Svicero (2012). Para cada emissão de metáfora
– trecho, foram extraídas medidas de 3 vogais, nomeadas a1 ([a] da palavra sApo da
emissão “sApo jururu”), a2 ([a] da palavra sApo da emissão “quando o sApo canta”), e
a3 ([a] da palavra sApo da emissão “mulher do sApo”), enquanto três vogais distintas
no mesmo trecho de extração de medidas do script ExpressionEvaluator. Para cada
emissão vocálica (a1, a2 e a3) de cada falante, foram registradas 3 repetições
O conjunto de dados acústicos foi inserido em planilha de dados, especificando-
se todas as medidas acústicas extraídas a partir do script ExpressionEvaluator, bem
como as medidas acústicas de frequências formânticas (F1, F2 e F3) das três vogais
de cada trecho a1, a2 e a3. Diante das modalidades de análises acústicas empregadas
(análise de longo termo para as edições metáforas-trecho e de curto termo para as
edições metáfora- vogal), foi realizado teste estatístico para se definir a forma de
apresentação dos dados referentes à vogal [a], cujos resultados serão apresentados ao
final do item 4.2.3. da metodologia.
4.2.3. Análise estatística
Os achados da análise de prontidão e de medidas acústicas (extraídas por meio
do Script ExpressionEvaluator) e de frequências formânticas foram submetidos a
36
tratamento estatístico por meio de análise multivariada, que permitiu estimar como as
emissões em voz cantada produzidas a partir de instruções baseadas em metáforas
refletem-se na qualidade acústica correspondente à emissão de mulheres com e sem
experiência em canto. Os testes realizados e o conjunto de variáveis analisadas
referiram-se a:
o Medidas acústicas (extraídas por meio do script ExpressionEvaluator e
medidas de frequências formânticas: F1, F2 e F3)
Análise aglomerativa hierárquica de cluster
o Medidas acústicas (medidas de frequências formânticas: F1, F2 e F3)
Teste ANOVA (comparação dos valores de F1, F2 e F3) para as 3
emissões vocálicas representativas de uma mesma metáfora- a1,
a2 e a3
o Elemento prontidão - extraído por meio do script ExpressionEvaluator
Regressão linear
Medidas acústicas (extraídas por meio do script
ExpressionEvaluator e frequências formânticas: F1, F2 e F3)
Medidas acústicas (extraídas por meio do script Expression
Evaluator)
Medidas acústicas (frequências formânticas: F1, F2 e F3)
Variáveis qualitativas (tipo de emissão (metáforas), grupo
(cantoras e não cantoras) e sujeitos)
Anova
Variáveis qualitativas: tipo de emissão (metáforas), grupo
(cantoras e não cantoras) e sujeitos;
Variáveis qualitativas: tipo de emissão (metáforas)
37
Variáveis qualitativas: grupo (cantoras e não cantoras)
Variáveis qualitativas: sujeitos
o Medidas acústicas (extraídas por meio do script ExpressionEvaluator e
frequências formânticas)- metáforas
Análise discriminante
o Medidas acústicas (extraídas por meio do script ExpressionEvaluator)-
metáforas
Análise discriminante
o Medidas acústicas (frequências formânticas: F1, F2 e F3)- metáforas
Análise discriminante
o Medidas acústicas (extraídas por meio do script ExpressionEvaluator)-
grupo (cantoras/não cantoras)
Análise discriminante
o Medidas acústicas (frequências formânticas)- (cantoras/não cantoras)
Análise discriminante
O detalhadamento dos métodos de análise estatística encontra-se no Anexo 6.
Conforme anteriormente referido, o teste ANOVA (para comparação dos valores
de F1, F2 e F3) para as 3 emissões vocálicas representativas de uma mesma
metáfora- a1, a2 e a3 revelou diferenças estatísticas para as medidas de F3 (p=0,001;
F=6,339, Fcrítico=3,021) das 3 vogais contidas numa mesma emissão produzida a
partir da instrução baseada em metáfora (a1, a2 e a3- referentes à vogal tônica da
produção “sApo” que ocorreu 3 vezes em cada trecho cantado representativo de cada
38
uma das emissões das três metáforas e naquelas sem metáforas). Quando realizadas
análises comparativas entre produções vocálicas para F3, diferenças foram
encontradas para vogais a1 e a2 (p=0,007; F=7,216, Fcrítico=3,880) e vogais a1 e a3
(p=0,0002; F=13,516, Fcrítico=3,880). Tais informações são ilustradas nas Figuras 7 a
9.
Figura 7. Gráfico boxplot da distribuição das medidas de frequências formânticas (F3) para três emissões da vogal [a] – a1, a2 e a3
Figura 8. Gráfico boxplot da distribuição das medidas de frequências formânticas (F1) para três emissões da vogal [a] – a1, a2 e a3
Figura 9. Gráfico boxplot da distribuição das
medidas de frequências formânticas (F2) para três
emissões da vogal [a] – a1, a2 e a3
39
Diante de tais achados, optou-se por analisar as frequências formânticas das
três emissões de forma diferenciada, sem traçar médias que poderiam ocultar as
diferenças por produções específicas de vogais.
Os dados foram analisados quanto à correspondência de dados de prontidão e
de medidas acústicas (extraídas por meio do script ExpressionEvaluator e de
frequências formânticas: F1, F2 e F3) para as emissões com e sem metáforas e
também nos grupos de cantoras e não cantoras e discutidos com base na literatura das
Ciências Vocais e das Ciências Fonéticas.
40
5. RESULTADOS
Os resultados são apresentados em tópicos relativos aos experimentos 1 e 2,
respectivamente nos itens 5.1 e 5.2.
5.1. Experimento 1- Análise integrada de dados acústicos e de imagem do trato
vocal: um estudo de caso
Os dados das imagens do trato vocal em situação de repouso, durante a
emissão de voz cantada produzida sem instrução baseada em metáforas e durante a
emissão em voz cantada produzida por meio de instruções baseadas em metáforas
(prisma, catedral e disco voador) são apresentados nas Figuras 10 a 14.
Vale ressaltar que o traçado referente ao cálculo da distância entre o dente
segundo pré-molar superior e o mento (queixo)- medida necessária ao cálculo de abertura
lábios normalizada- foi efetuado separadamente, pois, caso contrário, haveria
sobreposição na imagem e excesso de informações na mesma figura, dificultando a
observação da base de cálculos utilizada na presente pesquisa. A imagem com os valores
correspondentes a tais medidas encontram-se no anexo 9.
Figura 10. Dados de imagem de trato
vocal ilustrativos das medidas (em mm)
extraídas na situação de repouso
41
Emissão de [a] (sApo) – voz cantada sem
instrução baseada em metáfora
Emissão de [u] (jurUru) – voz cantada sem
instrução baseada em metáfora
Emissão de [i] (rIo) – voz cantada sem
instrução baseada em metáfora
Emissão de [i] (frIo) – voz cantada sem
instrução baseada em metáfora
Emissão de [Ɛ] (é que) – voz cantada sem
instrução baseada em metáfora
42
Figura 11. Dados de imagens de trato vocal ilustrativos das medidas (em mm) extraídas das
emissões em voz cantada produzidas sem intruções baseadas em metáforas
Emissão de [a] (sApo) – voz cantada
produzida por meio de instrução baseada
na metáfora prisma
Emissão de [u] (jurUru) – voz cantada
produzida por meio de instrução baseada
na metáfora prisma
Emissão de [i] (rIo) – voz cantada
produzida por meio de instrução baseada
na metáfora prisma
Emissão de [i] (frIo) – voz cantada
produzida por meio de instrução baseada
na metáfora prisma
43
Emissão de [Ɛ] (é que) – voz cantada
produzida por meio de instrução baseada
na metáfora prisma
Figura 12. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de imagens
extraídas das emissões em voz cantada produzidas por meio de instruções baseadas na
metáfora prisma.
Emissão de [a] (sApo) – voz cantada
produzida por meio de instrução baseada
na metáfora catedral
Emissão de [u] (jurUru) – voz cantada
produzida por meio de instrução
baseada na metáfora catedral
44
Emissão de [i] (rIo) – voz cantada
produzida por meio de instrução baseada
na metáfora catedral
Emissão de [i] (frIo) – voz cantada
produzida por meio de instrução
baseada na metáfora catedral
Emissão de [Ɛ] (é que) – voz cantada
produzida por meio de instrução baseada
na metáfora catedral
Figura 13. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de imagens
extraídas das emissões em voz cantada produzidas por meio de instruções baseadas na
metáfora catedral.
45
Emissão de [a] (sApo) – voz cantada
produzida por meio de instrução
baseada na metáfora disco voador
Emissão de [u] (jurUru) – voz cantada
produzida por meio de instrução
baseada na metáfora disco voador
Emissão de [i] (rIo) – voz cantada
produzida por meio de instrução
baseada na metáfora disco voador
Emissão de [i] (frIo) – voz cantada
produzida por meio de instrução
baseada na metáfora disco voador
Emissão de [Ɛ] (é que) – voz cantada
produzida por meio de instrução baseada
na metáfora disco voador
46
Figura 14. Dados de imagens de trato vocal ilustrativos das medidas (em mm) de imagens
extraídas das emissões em voz cantada produzidas por meio de instruções baseadas na
metáfora disco voador
Os resultados de medidas de frequências formânticas (F1, F2 e F3) e de
medidas de imagem do trato vocal são apresentados nas Tabelas 1 e 2
respectivamente para cada uma das vogais estudadas nas emissões de [a] sapo, [Ɛ] é
que, [i] rio e frio e [u] jururu.
Tabela 1. Medidas de frequências formânticas (Hz) para as emissões em voz cantada
produzidas por meio de instruções baseadas em metáforas e sem instruções baseadas em
metáforas para as emissões de [a] sapo, [Ɛ] é que, [i] rio e frio e [u] jururu
Vogal Emissão/Medidas F1 (Hz) F2 (Hz) F3 (Hz)
[a] sApo Prisma 888 1571 3009
[a] sApo Catedral 826 1687 3143
[a] sApo Disco Voador 933 1619 3120
[a] sApo Sem metáfora 903 1547 3054
Média 887,50 1606,00 3081,50
Desvio Padrão 45,07 61,74 61,31
[ɛ] é que Prisma 793 2141 3110
[ɛ] é que Catedral 708 2035 3256
[ɛ] é que Disco Voador 738 2081 3223
[ɛ] é que Sem metáfora 801 2266 3024
Média 760,00 2130,75 3153,25
Desvio Padrão 44,56 100,07 106,46
[i] rIo Prisma –rio 403 2543 2940
[i] frIo Prisma –frio 417 2599 3175
[i] rIo Catedral- rio 391 2597 3101
47
[i] frIo Catedral-frio 408 2453 3062
[i] rIo Disco Voador-rio 343 2397 3230
[i] frIo Disco Voador-frio 337 2530 3036
[i] rIo Sem metáfora-rio 428 2565 3027
[i] frIo Sem metáfora-frio 390 2591 3040
Média 389,63 2534,38 3076,38
Desvio Padrão 33,13 73,51 91,13
[u] jururu Prisma 457 2088 3578
[u] jururu Catedral 386 1090 2413
[u] jururu Disco Voador 295 1186 2581
[u] jururu Sem metáfora 516 2075 3555
Média 413,50 1609,75 3031,75
Desvio Padrão 95,21 546,16 621,34
Tabela 2. Medidas de imagem do trato vocal (mm) para as emissões em voz cantada
produzidas por meio de instruções baseadas em metáforas e sem instruções baseadas em
metáforas para as emissões [a] sapo, [Ɛ] é que, [i] rio e frio e [u] jururu.
Vogal Emissão/
Medidas
Abertura de lábios absoluta (mm)
Abertura de Mandíbula
(mm)
Abertura lábios Normalizada
(mm)
Distância
língua-
faringe
(mm)
Distância
língua-
palato
(mm)
[a] sApo Prisma 8 34,9 7,6 3,8 5,3
[a] sApo Catedral 8,4 36,2 7,4 4,2 5,1
[a] sApo Disco Voador 5,1 34 10,5 4,1 4,2
[a] sApo Sem metáfora 5,3 34,6 10,3 3,9 5,3
Média 6,70 34,93 8,95 4,00 4,98
Desvio Padrão 1,74 0,93 1,68 0,18 0,53
48
[ɛ] é que Prisma 6,8 41,8 11,7 7,3 4,8
[ɛ] é que Catedral 11,4 44,6 7,9 7,6 6,6
[ɛ] é que Disco Voador 5,7 41,6 13,8 8,1 5,2
[ɛ] é que Sem metáfora 8,9 43,1 10,7 8,1 6,7
Média 8,20 42,78 11,03 7,78 5,83
Desvio Padrão 2,51 1,39 2,45 0,39 0,97
[i] rIo Prisma -rio 2,4 39 16,7 8,6 1
[i] frIo Prisma -frio 2,4 37,8 17,1 8,8 1,2
[i] rIo Catedral- rio 2,9 38,7 16,7 8,1 1,2
[i] frIo Catedral-frio 5,8 41,4 13,7 8,7 1,5
[i] rIo Disco Voador-rio 1,3 37,4 18,4 8,2 1
[i] frIo Disco Voador-frio 1,6 37,1 18,1 9,2 1,3
[i] rIo Sem metáfora-rio 3,1 38,7 16,5 8,6 1,4
[i] frIo Sem metáfora-frio 4,1 38,4 15,5 8,2 1,3
Média 2,95 38,56 16,74 8,55 1,24
Desvio Padrão 1,45 1,33 1,53 0,37 0,18
[u] jurUru Prisma 1,2 30,9 14,1 4,4 2,5
[u] jurUru Catedral 2,5 31,5 13,3 5,1 1,2
[u] jurUru Disco Voador 1,2 31 15,4 4,8 2,2
[u] jurUru Sem metáfora 1,2 30,8 14,1 5 2,2
Média 1,53 31,05 14,23 4,83 2,03
Desvio Padrão 0,65 0,31 0,87 0,31 0,57
Para todas as emissões, as vogais [Ɛ] e [i] foram identificadas como qualificador
“anterior” em termos de deslocamento ântero-posterior de língua. Para todas as
emissões, as vogais [a] e [u] foram identificadas como qualificador “posterior” em
termos de deslocamento ântero-posterior de língua.
49
Os resultados de teste de correlação para medidas de frequências formânticas e
medidas de imagem do trato vocal são apresentados na Tabela 3 e na Figura 15 com
respeito às correlações encontradas para medidas de F1 e F2.
Tabela 3. Resultados de teste de correlação para medidas de frequências formânticas e
medidas de imagem do trato vocal (p<0,01)
F1 F2
Abertura de lábios absoluta (p=0,00)
Abertura de lábios normalizada (p<0,0001)
Distância dorso de língua- faringe (p=0,031)
Distância dorso de língua-palato (p<0,0001)
Abertura de mandíbula (p=0,01)
Abertura de lábios normalizada (p<0,015)
Distância dorso de língua- faringe (p<0,0001)
50
Figura 15. Gráficos da análise de correlações para medidas de frequências formânticas e
medidas de imagem do trato vocal
A análise fatorial revelou que os dois conjuntos de fatores, nomeados fatores 1 e
2, reponderam por 81,20% da distribuição das variáveis estudadas (Figura 16).
Congregadas no fator 1 (47,70%) situaram-se as seguintes variáveis (e respectivos
fatores de influência): Formante 1 – F1 (80,2%), medida de distância língua-faringe
(82,2%), medida de distância língua-palato (78,8%), Formante 2 – F2 (77,6%) e
elemento qualificador de deslocamento ântero-posterior da língua. Para o fator 2
(34,19%), congregaram-se as seguintes variáveis (e respectivos fatores de influência):
51
medida de abertura mandibular (92,5%) e medida de abertura de lábios absoluta
(62,5%).
Figura 16. Diagrama da análise fatorial de medidas de imagens do trato vocal e de medidas
acústicas de frequências formânticas (F1, F2 e F3)
A análise aglomerativa hierárquica de cluster revelou o agrupamento de três
classes, nas quais a concentração das variáveis esteve relacionada às vogais
estudadas. Na classe 1, estiveram congregadas as emissões das vogais [a] e [Ɛ] para
todas as emissões produzidas por meio de instruções baseadas em metáforas e sem
instruções baseadas em metáforas, além das emissões de vogal [u] na metáfora
prisma e sem instruções baseadas em metáforas. Na classe 2 congregaram-se as
emissões da vogal [i] produzidas por meio de instruções baseadas nas três metáforas
estudadas. Finalmente, na classe 3 estiveram agrupadas as emissões da vogal [u] para
as metáforas catedral e disco voador.
52
A análise de correlação canônica revelou correlação de formante 1-F1 com as
seguintes medidas de imagens de trato vocal: distância língua-palato (88,5%), abertura
de lábios normalizada (84,9%), abertura de lábios absoluta (75,1%). Para formante 2-
F2, as correlações foram evidenciadas para medida de distância língua-faringe
(83,5%), elemento qualificador de deslocamento ântero-posterior (81,9%), abertura
mandibular (56,3%) e abertura de lábios normalizada (54,6%).
A análise de regressão linear revelou fator de correlação de 98,7% para medida
de F1, 93,6% para F2 e 71,3% para F3 em relação às medidas de imagens do trato
vocal (Figura 17).
53
Figura 17. Gráficos de análise de regressão linear de medidas de imagens do trato vocal e de
medidas acústicas de frequências formânticas (F1, F2 e F3).
Os gráficos da análise Ancova, com o detalhamento da influência de cada um
dos formantes para as variáveis metáforas e vogais, são apresentados na Figura 18.
As siglas MC, MDV, MP e SM encontradas na parte inferior da figura referem-se
respectivamente às metáforas catedral, disco voador, prisma e sem metáfora.
55
Figura 18. Gráficos de análise Ancova para relação de medidas acústicas das frequências
formânticas (F1, F2 e F3) em relação às metaforas (coluna à esquerda) e às vogais analisadas
(coluna à direita)
A análise discriminante aplicada às frequências formânticas para detecção das
emissões estudadas (produzidas por meio de instruções baseadas em metáforas e
sem instruções baseadas em metáforas) não revelou possibilidade de segregação das
emissões. Quando aplicada a análise para as medidas de frequências formânticas para
detecção das vogais, o poder de estimação foi de 100% das emissões (Tabela 4 e
Figura 19).
Tabela 4. Matriz de confusão para resultados de validação cruzada da análise discriminante
para vogais a partir das medidas acústicas de frequências formânticas- F1, F2 e F3
de \ a [a] [i ] [u] [ɛ] Total % correto
[a] 4 0 0 0 4 100,00%
[i ] 0 8 0 0 8 100,00%
[u] 0 0 4 0 4 100,00%
[ɛ] 0 0 0 4 4 100,00%
Total 4 8 4 4 20 100,00%
Os dados da distribuição de centróides para estimação das vogais a partir das
medidas de frequências formânticas (F1, F2 e F3) são apresentados na Figura 19.
56
Figura 19. Gráfico de centróides da análise discriminante para estimação das vogais a partir
das medidas de frequências formânticas (F1, F2 e F3)
Os fatores que influenciaram a segregação das vogais referiram-se às medidas
de F1 (90,4%) e de F2 (72,3%).
No caso da análise discriminante aplicada às medidas de imagem do trato vocal
para detecção de metáforas, o melhor índice (60%) foi alcançado para a emissão
produzida por meio de instrução baseada na metáfora catedral (Tabela 5 e Figura 20).
Tabela 5. Matriz de confusão para resultados de validação cruzada da análise discriminante
para metáforas a partir das medidas de imagem do trato vocal
de \ a Catedral Disco
voador Prisma Metáfora Total %
correto
Catedral 3 1 1 0 5 60,00% Disco voador 0 1 2 2 5 20,00%
Prisma 2 0 1 2 5 20,00% Sem
Metáfora 1 2 1 0 4 0,00%
Total 6 4 5 4 19 26,32%
57
Os dados da distribuição de centróides para estimação das vogais a partir das
medidas de imagem do trato vocal são apresentados na Figura 20.
Figura 20. Gráfico de centróides da análise discriminante para estimação das metáforas a partir
das medidas de imagem do trato vocal
Os fatores que influenciaram a segregação referiram-se às medidas de abertura
de lábios normalizada (51,1%), abertura de lábios absoluta (42,9%) e de distância
língua-palato (53,3%).
No caso da análise discriminante aplicada às medidas de imagem do trato
vocal para detecção de vogais, o poder segregatório foi total (Tabela 6 e Figura 21).
Tabela 6. Matriz de confusão para resultados de validação cruzada da análise discriminante
para vogais a partir das medidas de imagem do trato vocal
58
de \ a [a] [i] [u] [ɛ] Total
%
correto
[a] 4 0 0 0 4 100,00%
[i] 0 7 0 0 7 100,00%
[u] 0 0 4 0 4 100,00%
[ɛ] 0 0 0 4 4 100,00%
Total 4 7 4 4 19 100,00%
Figura 21. Gráfico de centróides da análise discriminante para estimação das vogais a partir
das medidas de imagem do trato vocal
Os fatores que influenciaram a segregação referiram-se à qualificação de
deslocamento ântero-posterior (99,3%), medidas de distância língua-faringe (98,3%),
de distância língua-palato (97%), abertura de lábios absoluta (87,5%) e abertura de
mandíbula (81%).
No caso da análise discriminante aplicada às medidas acústicas de frequências
formânticas e de imagem do trato vocal para detecção de metáforas, o poder
segregatório foi parcial (20 a 60%), sendo, a mais elevada, para a metáfora catedral
(Tabela 7 e Figura 22).
59
Tabela 7. Matriz de confusão para resultados de validação cruzada da análise discriminante
para metáforas a partir das medidas acústicas de frequências formânticas e de imagem do trato
vocal
de \ a Catedral Disco
Voador Prisma Sem
Metáfora Total % correto
Catedral 3 1 1 0 5 60,00%
Disco Voador 1 2 0 2 5 40,00%
Prisma 2 1 1 1 5 20,00%
Sem Metáfora 0 1 2 1 4 25,00%
Total 6 5 4 4 19 36,84%
Figura 22. Gráfico de centróides da análise discriminante para estimação das metáforas a partir
das medidas de frequências formânticas e de medidas de imagem do trato vocal
Os fatores que influenciaram a segregação referiram-se à abertura de lábios
absoluta (37,2%), abertura de lábios normalizada (35,9%), distância língua-palato
(36,8%) e F3 (34,6%).
As informações referentes à distribuição das medidas acústicas de frequências
formânticas (F1, F2 e F3 tabelas 1 e 2) e de medidas de imagem do trato vocal são
apresentadas graficamente nas figuras 23 e 24.
60
Figura 23. Gráfico radar da distribuição das frequências formânticas nas diversas emissões
estudadas
Figura 24. Gráfico radar da distribuição das medidas de imagens do trato vocal nas diversas
emissões estudadas
61
5.2. Experimento 2- Análise acústica de emissões em voz cantada (produzidas
por meio de instruções baseadas em metáforas) por cantoras e não cantoras
Os resultados desta etapa de estudos são apresentados enquanto dados
acústicos (medidas extraídas pelo script ExpressionEvaluator e medidas de
frequências formânticas - F1, F2 e F3), além de dados de prontidão extraídos pelo
script ExpressionEvaluator para as emissões em voz cantada produzidas por meio de
instruções baseadas em metáforas por cantoras e não cantoras.
5.2.1. Medidas acústicas extraídas pelo script ExpressionEvaluator e de
frequências formânticas (F1, F2 e F3)
As informações referentes às medidas acústicas extraídas por meio do script
ExpressionEvaluator para as emissões em voz cantada produzidas por meio de
instruções baseadas em metáforas (prisma, catedral e disco voador) e sem instruções
baseadas em metáforas são apresentados nas Tabelas 8 e 9.
Tabela 8. Valores de médias e desvio padrão de medidas acústicas do script
ExpressonEvaluator para as emissões em voz cantada produzidas por meio de instruções
baseadas em metáforas (catedral, prisma e disco voador) e sem instruções baseadas em
metáforas
62
Metáfora
\ Medida
acústica
Mediana
de f0
Semi-
amplitude
entre
quartis de
f0
Quantil
99,5%
de f0
Assimetria
de f0
Média
de 1a.
derivada
de f0
Desvio
padrão
de 1a.
derivada
de f0
Assimetria
de 1a.
derivada
de f0
Assimetria
de
intensidade
Média
de
declínio
espectral
Desvio
padrão
de
declínio
espectral
Assimetria
de
declínio
espectral
Desvio
Padrão
LTAS
Catedral 351,320 121,858 1,049 -0,105 0,068 0,011 -1,703 3,167 1,987 2,430 1,452 0,920
Disco
Voador 326,800 121,795 0,972 -0,043 0,053 0,011 -1,483 2,913 2,477 2,920 1,391 1,119
Prisma 324,200 121,745 0,933 -0,058 0,067 0,010 -2,830 2,897 2,117 2,580 1,445 0,970
Sem
metáfora 310,512 121,665 0,858 -0,074 0,055 0,010 -2,560 2,277 2,377 2,820 1,402 1,151
Média 330,92 121,76 0,95 -0,09 0,06 0,01 -2,13 2,72 2,18 2,63 1,43 1,04
Desvio
Padrão 16,98 0,08 0,08 0,03 0,01 0,00 0,65 0,38 0,23 0,22 0,03 0,11
63
Tabela 9. Resultados do teste de distâncias de Fisher (p-valores) para as médias de
medidas acústicas do script ExpressionEvaluator para as emissões em voz cantada
produzidas por meio de instruções baseadas em metáforas (catedral, prisma e disco
voador) e sem instruções baseadas em metáforas
Catedral Disco Voador Prisma Sem Metáfora
Catedral 1 < 0,0001* 0,343 < 0,0001*
Disco Voador < 0,0001* 1 0,065 0,115
Prisma 0,343 0,065 1 0,053
Sem metáfora < 0,0001* 0,115 0,053 1
*p<0,01
As informações referentes às medidas acústicas de frequências
formânticas (F1, F2 e F3) para as emissões produzidas por meio de instruções
baseadas em metáforas (prisma, catedral e disco voador) e sem instruções
baseadas em metáforas são apresentadas nas tabelas 10 e 11.
Tabela 10. Valores de média e desvio padrão de medidas acústicas – frequências
formânticas- para as emissões produzidas por meio de instruções baseadas em
metáforas (catedral, prisma e disco voador) e sem instruções baseadas em metáforas.
64
Metáfora \ Medida
acústica (emissão)
F 1
(a1)
F2
(a1)
F3
(a1)
F1
(a2)
F2
(a2)
F3
(a2)
F1
(a3)
F2
(a3)
F3
(a3)
Catedral 869,133 1420,100 2804,300 885,400 1508,733 2773,867 874,367 1461,600 2715,533
Disco Voador 838,933 1471,267 2948,833 854,067 1496,067 2851,467 824,767 1429,367 2729,333
Prisma 869,900 1497,033 2851,300 862,033 1522,567 2769,467 901,967 1475,933 2687,267
Sem metáfora 861,267 1529,233 2878,400 898,500 1520,233 2663,567 847,833 1486,667 2740,300
Média 859,81 1479,41 2870,71 875,00 1511,90 2764,59 862,23 1463,39 2718,11
Desvio Padrão 14,45 46,10 60,41 20,55 12,16 77,16 33,35 24,90 22,92
65
Tabela 11. Resultados do teste de distâncias de Fisher (p-valores) para as médias de
medidas acústicas – frequências formânticas- para as emissões em voz cantada
produzidas por meio de instruções baseadas em metáforas (catedral, prisma e disco
voador) e sem instruções baseadas em metáforas
Catedral
Disco
Voador Prisma
Sem
metáfora
Catedral 1 0,161 0,211 0,044
Disco Voador 0,161 1 0,110 0,297
Prisma 0,211 0,110 1 0,017
Sem metáfora 0,044 0,297 0,017 1
*p<0,01
A análise aglomerativa hierárquica de cluster revelou 3 agrupamentos
em termos das medidas acústicas abordadas: classe 1 (todas as medidas
acústicas geradas pelo script ExressionEvaluator), classe 2 (medidas de
frequências formânticas- F1 e F2) e Classe 3 (medida de frequência
formântica- F3). Tais achados reforçam a demanda por abordagem
diferenciada dos grupos de medidas acústicas (extraídas pelo script
ExpressionEvaluator e de frequências formânticas-F1, F2 e F3).
A análise discriminante aplicada ao conjunto de medidas acústicas
(script ExpressionEvaluator e frequências formânticas) para detecção das
metáforas estudadas revelou possibilidade parcial de segregação das
metáforas (40 a 66,67%) Tabela 12 e Figura 25.
Tabela 12. Matriz de confusão para resultados de validação cruzada da análise
discriminante para metáforas a partir das medidas acústicas (script Expression
Evaluator e frequências formânticas)
66
de \ a Catedral
Disco
Voador Prisma
sem
metáfora Total
%
correto
Catedral 20 2 5 3 30 66,67%
Disco Voador 4 13 6 7 30 43,33%
Prisma 7 6 12 5 30 40,00%
Sem metáfora 2 9 5 14 30 46,67%
Total 33 30 28 29 120 49,17%
Figura 25. Gráfico de centróides da análise discriminante para estimação das
metáforas a partir das medidas acústicas (script Expression Evaluator e frequências
formânticas)
Os fatores que influenciaram a segregação referiram-se às medidas de
declínio espectral (39,7%), assimetria de intensidade (30,9%), formante 1-F1
(35,2%) e assimetria de f0 (26,9%).
A análise discriminante aplicada ao conjunto de medidas acústicas
(script ExpressionEvaluator) para detecção das metáforas estudadas revelou
possibilidade parcial de segregação das emissões (26,67% para a metáfora
prisma ao máximo de 60% para a metáfora catedral) Tabela 13 e Figura 26.
67
Tabela 13. Matriz de confusão para resultados de validação cruzada da análise
discriminante para metáforas a partir das medidas acústicas (script
ExpressionEvaluator)
de \ a Catedral
Disco
Voador Prisma
Sem
metáfora Total
%
correto
Catedral 18 5 6 1 30 60,00%
Disco Voador 4 11 6 9 30 36,67%
Prisma 10 7 8 5 30 26,67%
Sem metáfora 3 5 10 12 30 40,00%
Total 35 28 30 27 120 40,83%
Figura 26. Gráfico de centróides da análise discriminante para estimação das
metáforas a partir das medidas acústicas (script Expression Evaluator)
Os fatores que influenciaram a segregação referiram-se às medidas de
declínio espectral (desvio padrão: 62,4%; média: 77%), assimetria de f0
(53,9%) e assimetria de intensidade (50,7%).
A análise discriminante aplicada ao conjunto de medidas acústicas
(frequências formânticas) para detecção das metáforas estudadas revelou
possibilidade parcial de segregação das emissões (26,67% para a metáfora
68
disco voador ao máximo de 46,67% para as emissões sem metáfora) - Tabela
14 e Figura 27.
Tabela 14. Matriz de confusão para resultados de validação cruzada da análise
discriminante para metáforas a partir das medidas acústicas (frequências formânticas)
de \ a Catedral
Disco
Voador Prisma
sem
metáfora Total % correto
Catedral 8 6 9 7 30 26,67%
Disco Voador 7 7 6 10 30 23,33%
Prisma 10 5 11 4 30 36,67%
Sem metáfora 2 8 6 14 30 46,67%
Total 27 26 32 35 120 33,33%
Figura 27. Gráfico de centróides da análise discriminante para estimação das
metáforas a partir das medidas (frequências formânticas)
Os fatores que influenciaram a segregação referiram-se à medida de
frequência formântica- F1 (43,9%).
As informações referentes às medidas acústicas extraídas por meio do
script ExpressionEvaluator para as emissões de cantoras e não cantoras são
apresentadas nas Tabelas 15 e 16.
69
Tabela 15. Valores de médias e desvio padrão de medidas acústicas do script ExpressionEvaluator para as emissões de cantoras e não
cantoras
Experiência canto\
Medidas acústicas
Mediana
de f0
Semi-
amplitude
entre
quartis
de f0
Quantil
99,5%
de f0
Assimetria
de f0
Média
de 1a.
derivada
de f0
Desvio
padrão
de 1a.
derivada
de f0
Assimetria
de 1a.
derivada
de f0
Assimetria
de
intensidade
Média
de
declínio
espectral
Desvio
padrão
de
declínio
espectral
Assimetria
de
declínio
espectral
Desvio
Padrão
LTAS
Cantora 368,360 122,008 1,181 -0,085 0,067 0,012 -0,128 3,092 2,207 2,667 1,429 1,010
Não Cantora 288,056 121,523 0,725 -0,056 0,055 0,010 -4,160 2,535 2,272 2,708 1,416 1,070
Média 328,21 121,77 0,95 -0,07 0,06 0,01 -2,14 2,81 2,24 2,69 1,42 1,04
Desvio Padrão 56,78 0,34 0,32 0,02 0,01 0,00 2,85 0,39 0,05 0,03 0,01 0,04
70
Tabela 16. Resultados do teste de distâncias de Fisher (p-valores) para as médias de
medidas acústicas do script ExpressionEvaluator para as emissões de cantoras e não
cantoras
Cantoras Não Cantoras
Cantoras 1 < 0,0001*
Não Cantoras < 0,0001* 1
*p<0,01
As informações referentes às medidas acústicas de frequências
formânticas para as emissões de cantoras e não cantoras são apresentadas
nas Tabelas 17 e 18.
Tabela 17. Valores de média e desvio padrão de frequências formânticas para as
emissões 1, 2 e 3 da vogal [a] em “sapo” para as emissões de cantoras e não cantoras
Tabela 18. Resultados do teste de distâncias de Fisher (p-valores) para as médias de
medidas acústicas – frequências formânticas (F1, F2 e F3)- para as emissões 1, 2 e 3
da vogal [a] em “sapo” para as emissões de cantoras e não cantoras
Cantoras Não Cantoras
Cantoras 1 < 0,0001*
Não Cantoras < 0,0001* 1
*p<0,01
Experiência
canto \
Medida
acústicas
F1
(a1)
F2
(a1)
F3
(a1)
F1
(a2)
F2
(a2)
F3
(a2)
F1
(a3)
F2
(a3)
F3
(a3)
Cantora 818,817 1385,267 2821,450 859,517 1442,800 2636,400 828,950 1348,183 2595,800
Não
Cantora 900,800 1573,550 2919,967 890,483 1581,000 2892,783 895,517 1578,600 2840,417
Média 859,81 1479,41 2870,71 875,00 1511,90 2764,59 862,23 1463,39 2718,11
Desvio
Padrão 57,97 133,14 69,66 21,90 97,72 181,29 47,07 162,93 172,97
71
A análise discriminante aplicada ao conjunto de medidas acústicas
(script ExpressionEvaluator) para detecção dos grupos de cantoras e não
cantoras estudadas revelou possibilidade de segregação das emissões (85%
não cantoras e 90% cantoras) Tabela 19 e Figura 28.
Tabela 19. Matriz de confusão para resultados de validação cruzada da análise
discriminante para grupo de cantoras e não cantoras a partir das medidas acústicas
(script ExpressionEvaluator)
de \ a Cantoras
Não
Cantoras Total
%
correto
Cantoras 54 6 60 90,00%
Não Cantoras 9 51 60 85,00%
Total 63 57 120 87,50%
Figura 28. Gráfico de centróides da análise discriminante para estimação dos grupos
de cantoras e de não cantoras a partir das medidas acústicas (script
ExpressionEvaluator)
Os fatores que influenciaram a segregação referiram-se às medidas de
f0 (quantil 99,5%: 86,6%; semiamplitude entre quartis: 85,8% e mediana:
84,1%) e assimetria de intensidade (55,1%).
72
A análise discriminante aplicada ao conjunto de medidas acústicas
(frequências formânticas-F1, F2 e F3) para detecção dos grupos de cantoras e
não cantoras estudadas revelou possibilidade de segregação das emissões
(78,33% para não cantoras e 75% para cantoras)- Tabela 20 e Figura 29.
Tabela 20. Matriz de confusão para resultados de validação cruzada da análise
discriminante para grupo de cantoras e não cantoras a partir das medidas acústicas
(frequências formânticas-F, F2 e F3)
de \ a Cantoras
Não
Cantoras Total % correto
Cantoras 45 15 60 75,00%
Não Cantoras 13 47 60 78,33%
Total 58 62 120 76,67%
Figura 29. Gráfico de centróides da análise discriminante para estimação dos grupos
de cantoras e de não cantoras a partir das medidas acústicas (frequências
formânticas-F1, F2 e F3)
Os fatores que influenciaram a segregação referiram-se basicamente às
medidas de F2 em suas três repetições (82,4% a 52,10%).
73
5.2.2. Dados de prontidão extraídos pelo script ExpressionEvaluator
Quanto ao aspecto prontidão, a análise de regressão linear detectou
98,8% de correlação às medidas do script ExpressionEvaluator (Figura 30):
Figura 30. Gráfico de análise de regressão linear de medidas acústicas do script
ExpressionEvaluator e prontidão
Os fatores que influenciaram a segregação referiram-se basicamente às
medidas de declínio espectral (assimetria: 95,4%, média: 90,3%, desvio
padrão: 77,2 %) e LTAS- desvio padrão (90,07%).
Quanto ao mesmo aspecto de prontidão, a análise de regressão linear
detectou 68,2% de correlação às medidas de frequências formânticas (Figura
31):
74
Figura 31. Gráfico de análise de regressão linear de medidas acústicas de frequências
formânticas- F1, F2 e F3 para as várias emissões da vogal [a] (a1, a2, a3) e prontidão
Os fatores que influenciaram a segregação referiram-se basicamente às
medidas de formante - F1 em suas várias repetições (61% a 55,1%).
Quanto ao aspecto prontidão, a análise de regressão linear detectou
99% de correlação ao conjunto de medidas do script ExpressionEvaluator e de
frequências formânticas (Figura 32):
75
Figura 32. Gráfico de análise de regressão linear de medidas acústicas do script
ExpressionEvaluator conjugadas às de frequências formânticas (para as várias
emissões da vogal [a] - a1, a2, a3) e prontidão
Os fatores que influenciaram a segregação referiram-se basicamente às
medidas de declínio espectral (assimetria: 95,4% e média: 90,3%) e LTAS-
desvio padrão (90,7%).
A análise de regressão linear da prontidão em relação às variáveis
qualitativas (tipo de emissão- metáforas, grupo (cantoras e não cantoras) e
sujeitos) revelou 86,5% de correlação (Figura 33):
76
Figura 33. Gráfico de análise de variáveis qualitativas: grupo (cantoras e não
cantoras), sujeitos, tipo de emissão (metáforas) em relação à prontidão
Análise Anova de relação prontidão e grupo (cantoras e não cantoras)
revelou baixa correlação (0,5%).
Análise Anova de relação prontidão e sujeitos revelou correlação de
75,6%- Figura 34.
Figura 34. Gráfico de análise ANOVA de variáveis qualitativas (sujeitos) e prontidão
Análise Anova de relação prontidão e instrução (metáforas) revelou
baixa correlação (5,2%).
77
6. DISCUSSÃO
Diante da proposta de investigação da atividade do trato vocal por meios
acústico e articulatório (imagem do trato vocal, mais especificamente, imagens
videofluoroscópicas), especialmente no que se refere às metáforas utilizadas
como instruções para o canto, este tópico visa articular os achados dos dois
experimentos apresentados. Para tanto, num primeiro momento, são discutidos
os dados de cada experimento de forma separada, e, ao final, de forma
integrada.
O primeiro experimento contemplou um estudo de caso que envolveu
análise acústica e de imagem do trato vocal por meio da técnica de
videofluoroscopia por uma informante não cantora. O segundo experimento
explorou dados acústicos de dois grupos: cantoras e não cantoras.
6.1. Experimento 1- Análise integrada de dados acústicos e de imagem do trato vocal: um estudo de caso
No experimento 1, o enfoque recaiu na descrição preliminar dos achados
acústicos e articulatórios gerados por registros de emissões em voz cantada
produzidos por meio de instruções baseadas em metáforas, a partir da técnica
da videofluoroscopia.
A inspeção visual dos registros de imagem do trato vocal revelou, num
primeiro momento, a maior tendência à abertura mandibular na metáfora
catedral, especialmente para as vogais aberta [a] e semiaberta [Ɛ] estudadas.
78
Quando consideradas as medidas acústicas (frequências formânticas),
as metáforas catedral e disco voador revelaram similaridade de achados,
sendo que na vogal [u] todas as frequências formânticas estiveram rebaixadas
quando comparadas à emissão sem instrução baseada em metáforas. Tal
achado revela a tendência de alongamento do trato vocal e a possibilidade de
implementação de ajuste de laringe abaixada (KENT, READ, 1992;
MEDEIROS, 2002). Para as demais emissões vocálicas, houve tendência a
rebaixamento de frequências de F1 e F2 e padrão variável de valores de F3.
Para a metáfora disco voador, F1 revelou tendência a rebaixamento de
frequência para a maioria das vogais, enquanto F2 apresentou-se rebaixado
em frequência em todas as vogais e apresentou padrão variável de valores de
F3. As medidas acústicas representativas de emissões produzidas por meio de
instrução baseada na metáfora prisma foram similares às emissões produzidas
sem instruções baseadas em metáforas.
As interações de f0 com as frequências formânticas têm sido exploradas
no universo do canto há algumas décadas (SUNDBERG,1990; SUNDBERG,
SKOOG, 1997), com destaque para a sintonia de frequências de formantes
mais graves (especialmente F1 e F2) com os primeiros harmônicos,
especialmente nas vozes femininas mais agudas, que geralmente são
produzidas em tratos vocais de menor extensão, como aqueles de sopranos
(SUNDBERG, 1975; CARLSSON, SUNDBERG, 1992; SUNDBERG, SKOOG,
1997). Tal efeito confere uma sensação de facilidade, suavidade ao cantar em
tons agudos, mas não pode ser encarado com um princípio geral no canto,
especialmente por questões relativas à própria qualidade da emissão produzida
(CARLSSON, SUNDBERG, 1992). A sintonia é alcançada por meio de abertura
79
mandibular, que permite manter os níveis da frequência de F1 elevados
(SUNDBERG, SKOOG, 1997), destacando-se que a abertura mandibular é
importante no canto, mas não o único recurso para projeção vocal e não
restrita a sopranos.
Do ponto de vista das medidas de mobilizações de articuladores
extraídas das imagens videofluoroscópicas do trato vocal durante a produção
de voz cantada, algumas tendências foram reveladas para cada emissão
produzida por meio de instruções baseadas em metáforas: catedral (maior grau
de abertura de lábios e mandíbula, além de expansão faríngea), prisma (maior
grau de abertura de lábios, sem correspondente em termos da abertura de
mandíbula, língua elevada e menor amplitude de faringe) e disco voador
(menor grau de abertura de lábios e mandíbula, língua elevada e expansão
faríngea). Desta exposição, depreende-se que as instruções baseadas na
metáfora catedral promoveram, no sujeito estudado, maiores efeitos sobre os
ajustes de mandíbula e de faringe; as instruções baseadas na metáfora prisma
promoveram ajustes de lábios, enquanto as instruções baseadas na metáfora
disco voador centraram-se no estímulo à implementação de ajustes de língua e
de mandíbula.
Destas observações, destacamos que o estudo de imagens do trato
vocal permitiu revelar refinamentos e detalhes dos efeitos das mobilizações do
trato vocal em resposta ao uso de instruções baseadas em metáforas.
Conforme salientado, para algumas emissões, houve sugestões, reforçadas
por dados acústicos, de que haveria um alongamento do trato vocal,
possivelmente por abaixamento da laringe. Estudo de Sundberg (1970) já
80
destacava que o rebaixamento de F2 sofria influências de abaixamento
laríngeo no canto.
Dados de mobilização laríngea não foram mensurados tanto pela
ausência de referências de uso do software Osiris para tal medida, quanto pela
dificuldade para delimitar a borda inferior da cartilagem cricóide (WILIAMS,
ECCLES, 1990), especialmente diante da área delimitada nas imagens
videofluoroscópicas coletadas.
De acordo com Sousa et al (2010), após análise de questionários
aplicados a professores de canto, nota-se que há correspondências de ações
musculares vinculadas às metáforas. No caso das metáforas “voz como uma
lâmpada” e “bolha de sabão” estimam-se atividade fonatória e pressão
subglótica equilibradas, além disso, sugerem maior atenção e percepção
auditiva. Na metáfora “cúpula de uma igreja dentro da boca” há
correspondências com a elevação da região do palato. Em comparação aos
dados do experimento 1, a metáfora catedral apresentou a similaridade em
termos de atividade muscular, uma vez que há efeitos de ajustes de mandíbula
e de dimensão faríngea em sua produção.
Dessa maneira, há indícios de que as instruções baseadas em
metáforas tenham levado o sujeito estudado a promover ajustes diferenciados
de trato vocal em função da exposição ao estímulo de instruções baseadas em
metáforas para a produção de emissões em voz cantada (CLEMENTS, 2008;
SOUSA et al, 2010; ROSSBACH, 2011).
Sundberg (1970) conduziu estudo comparativo entre fala e canto, com
experimento baseado em coleta de dados radiográficos e acústicos. Na
descrição de esquemas de imagens referentes ao canto, com a ressalva de
81
que estudou apenas informantes do gênero masculino, a descrição
assemelhou-se a dados de algumas das metáforas estudadas, especialmente
catedral e disco voador, quanto à ampliação de faringe e ao abaixamento de
laringe. Tais indicações reforçam que as metáforas colaboraram para
implementação de ajustes de qualidade vocal característicos de emissões em
voz cantada e essas representações simbólicas são capazes de gerar
diferentes sensações proprioceptivas, motoras e táteis (FONAGY, 2000).
Desta forma, a análise conjugada de dados acústicos e de medidas de
imagens do trato vocal mostrou-se promissora para o enfoque das
mobilizações desenvolvidas para a emissão em voz cantada. Os dados de
outros sujeitos poderiam agregar maiores informações sobre a questão do uso
das metáforas como elementos de instrução para que o cantor (e o aprendiz de
canto) possa atingir ajustes no trato vocal que contemplem os esfeitos estéticos
desejáveis (CLEMENTS, 2008; SOUSA et al, 2010; ROSSBACH, 2011).
Retomando os dados do experimento, a análise discriminante de todas
as medidas de frequências formânticas para estimação das metáforas revelou
que não houve diferenciação das emissões, ou seja, as medidas acústicas
(frequências formânticas) não permitiram diferenciar as emissões produzidas
por meio de instruções baseadas em metáforas, mas, em contrapartida,
segregaram as diferentes vogais estudadas. Tais achados podem estar
relacionados ao fato de que todas as vogais foram analisadas de forma
conjugada. Não houve condições de análise diferenciada por vogais, uma vez
que não havia repetições, em função das razões de biossegurança
anteriormente expostas no capítulo de metodologia (tempo de exposição à
radiação).
82
Neste tocante, os achados de análise aglomerativa hierárquica de
cluster reforçaram tal tendência, uma vez que as três classes geradas
agruparam as vogais, de forma mais consistente que as metáforas, ou seja, os
agrupamentos revelaram a segregação predominante das classes em função
das vogais estudadas.
Refletindo sobre esse aspecto, sugerimos que outras técnicas já
utilizadas em pesquisas de atividade do trato vocal na fala e no canto, tais
como a ressonância magnética (GREGIO, 2006; SUNDBERG, 2008;
VENTURA et al, 2010) ou ultrassonografia para imagens de língua (SVICERO,
2012), as quais permitem o registro de maiores números de repetições de
emissões, sejam futuramente empregadas.
Para análise de vogais e o poder segregatório das medidas formânticas,
detectou-se a influência de medidas de F1 e F2, em concordância com a
literatura fonética, no sentido de que a identidade fonética das vogais é
garantida pela combinação das medidas de F1 e F2 (FANT, 1960; KENT,
READ, 1992; MEDEIROS, 2002) e que situações específicas do canto levam a
padrões peculiares de distribuição de frequências formânticas (SUNDBERG,
1970; SUNDBERG,1982; SUNDBERG, 1990; MEDEIROS, 2002; VIEIRA,
2004; HANAYAMA et al, 2009).
Outro aspecto interessante, relatado em estudo com dados acústicos e
articulatórios- tomografia computadorizada, refere-se à dificuldade em se
estimar a área da faringe, apesar de sua importante contribuição na ação de
filtro de trato vocal (SUNDBERG et al, 1987). O estudo, com base em registros
vocálicos de dois falantes (um homem e uma mulher), revelou a possibilidade
de que as diferenças entre homens e mulheres em termos de dimensões
83
faríngeas estariam concentradas nas porções superior e inferior e não na
porção média. Dados de qualidades diferenciadas de efeitos na qualidade
vocal a partir da contração de músculos constritores superior, médio e inferior
da faringe também foram descritos em publicações que enfocam a fisiologia da
voz (PINHO, PONTES, 2008; HANAYAMA et al, 2009).
Do ponto de vista dos dados de análise de imagem do trato vocal, a
análise discriminante revelou poder segregatório parcial para estimação das
metáforas estudadas (máximo de 60% para catedral), com infuência das
medidas de abertura de lábios (absoluta e normalizada) e distância língua-
palato. Por outro lado, a análise discriminante de medidas de imagem de trato
vocal para segregação das vogais, revelou a taxa de segregação total (100%),
com maior influência do elemento qualificador de deslocamento ântero-
posterior de língua, medidas de distância língua-faringe, língua-palato, abertura
de lábios e de mandíbula.
Do ponto de vista das correlações acústico-articulatórias, a análise
fatorial revelou agrupamento das medidas acústicas de F1 com medidas de
distância língua-faringe e língua-palato, enquanto F2 agrupou-se a elemento
qualificador de deslocamento ântero-posterior de língua, além de abertura de
lábios e mandibula. Complementar à análise de agupamentos, quando
aplicados os testes estatísticos de correlações, a análise de correlação
canônica revelou correlações de medidas acústicas de F1 a medidas de
distância dorso de língua-palato, que expressa o grau de altura da língua, de
abertura de lábios (absoluta e normalizada); enquanto medidas acústicas de F2
correlacionaram-se a medida de distância língua-faringe, que expressa o
deslocamento ântero-posterior, e elemento qualificador de deslocamento
84
ântero-posterior de língua e medida de abertura mandibular. Tais dados são
compatíveis com os fundamentos da teoria acústica da produção da fala,
conforme abaixo exposto, exceto pela associação de medidas de F2 a abertura
mandibular.
Quanto a estes achados, o diâmetro das cavidades e a extensão total do
trato vocal influenciam a descrição e a caracterização acústica das vogais
(LIEBERMAN, BLUMSTEIN, 1988). Tal caracterização fonética é propiciada
pela análise dos formantes (FANT, 1960), destacando-se que as medidas de
frequências de F1 e F2 são influenciadas pelos movimentos de língua, sendo
F1 pela movimentação no eixo vertical (movimentação de mandíbula) e F2 no
eixo horizontal (movimentação ântero-posterior), enquanto as medidas F3
estão relacionadas ao grau de passagem da constrição (FANT, 1960; KENT,
READ, 1992).
Neste ponto da discussão, cabe retomar as referências de Sundberg
(1970, 1982, 1990, 1992) a particularidades da emissão em voz cantada em
relação à fala, destacando justamente a influência do ajuste de abertura
mandibular, cujos efeitos acústicos seriam inicialmente esperados sobre F1:
parece poder ser atribuída a uma compensação do efeito de abaixamento de
laringe, sendo que, em estudo de estimação de efeitos acústicos em função de
dados articulatórios, Sundberg (1970) destacou que F2 também sofreria
influências mais acentuadas do ajuste de laringe abaixada na situação de
canto.
Retomando estudos da voz cantada feminina, de acordo com Vieira
(2004), pela iniciativa de projetar sua voz tais cantoras realizam o abaixamento
de mandíbula e tal ajuste faz coincidir os valores de F1 com os da frequência
85
fundamental, permitindo maior audibilidade vocal. Todavia, o que também se
pode notar nesse pareamento de valores é pouca inteligibilidade do texto (DI
CARLO, 1994) o qual era visto anteriormente somente como problema de má
articulação das vogais e consoantes durante o canto (MEDEIROS, 2002).
Finalmente, a análise de regressão linear revelou correlações entre as
imagens do trato vocal com as medidas acústicas de F1 e F2, novamente
reforçando o aspecto da identidade fonética das vogais, garantida pela
combinação das informações acústicas de F1 e F2 (FANT, 1960; KENT, READ,
1992).
Além disso, a participante do estudo de caso, não era, de fato, cantora e,
portanto, os ajustes implementados podem ser mais próximos àqueles usados
na fala. Tais dados podem representar a demanda com que o professor de
canto poderá se deparar ao iniciar o trabalho de instrução por meio de
metáforas.
Existem estudos na literatura sobre análise de formantes durante a
produção de fala (MENDES, 2003; OLIVEIRA, 2011), durante a produção de
fala e canto (MEDEIROS, 2002) e de fala com análise associada de imagem de
ultrassonografia (SVICERO, 2012).
Medeiros (2002) aponta que as vogais produzidas durante o canto
revelam ajustes de abaixamento da mandibula (SUNDBERG, 1970;
SUNDBERG, 1977) e de menor avultamento da língua (com exceção da vogal
[a]) para manter afinação de f0, portanto, compatíveis com achados do
presente estudo, especialmente para a metáfora catedral, a qual revelou o
maior grau de abertura mandibular, especialmente nas vogais [a] e [Ɛ].
86
Sundberg (1970) também relatou efeitos acústicos e articulatórios
diferenciados no canto em função das vogais. No caso das anteriores, maiores
diferenças seriam encontradas na dimensão da cavidade faríngea e na
abertura labial, efeitos estes que poderiam estar relacionados aos ajustes de
abaixamento laríngeo e, portanto, a associação de tais mobilizações teria uma
base fisiológica, uma vez que ajuste de laringe elevada pode levar a efeitos
negativos na dinâmica de pregas vocais. Além disso, reforçou o cuidado em se
considerar a dependência dos achados à classificação vocal, pitch habitual no
canto e o formato do trato vocal do cantor estudado.
Retomando os dados de análise estatística do presente estudo, a
análise discriminante de medidas acústicas e de imagem do trato vocal com
metáfora revelou novamente poder segregatório parcial, com máximo de 60%
de poder discriminante para metáfora catedral e mínimo de 20% para disco
metáfora voador. Os fatores que influenciaram tal segregação referiram-se a
medidas de imagem do trato vocal: abertura de lábios (absoluta e normalizada),
distância língua-palato e medida acústica de F3. Em termos de F3, tem-se a
indicação de que a medida estaria mais relacionada a ajustes específicos de
qualidade vocal (portanto mais individuais) e não diretamente à identidade
fonética da vogal, quando considerados os preceitos de produção da fala
(KENT, READ, 1992; MEDEIROS, 2002).
A esta altura da discussão, cabe, finalmente, pontuar algumas limitações
experimentais em função dos procedimentos de coleta de dados, tais como: o
contexto das emissões vocálicas (não controlado para extração de medidas
formânticas); o tempo de exposição à radiação, limitando o tempo de coleta
(não foram registradas repetições de emissões, o que poderia permitir estudar
87
uma mesma vogal em diferentes repetições- como ocorreu no experimento 2);
a representatividade das vogais orais do português brasileiro (não foi possível o
registro de todas as vogais orais e, ainda, contamos com encontro vocálico,
como nos casos de rio e frio) e a qualidade da gravação do estímulo de áudio
para realização da análise acústica (dadas as condições do ambiente de
coleta, optamos por extrair a pista de áudio do próprio vídeo das imagens de
videofluoroscopia, cuja coleta ocorre em ambiente não tratado acusticamente).
Finalmente, não houve oportunidade de registro de outro sujeito de grupo de
cantores, o que poderia facilitar a comparação aos dados do experimento 2. O
experimento 2 foi concebido justamente para propiciar as condições
experimentais compatíveis com os procedimentos da Fonética Experimental
(BOIX, 1991), no enfoque dos efeitos o uso de metáforas como elementos de
instrução no ensino da voz cantada.
Diante das questões de pesquisa elencadas na introdução do presente
estudo, podemos destacar que os achados do experimento 1 sinalizam que
algumas das metáforas estudadas propiciaram mobilizações diferenciadas do
trato vocal, especialmente catedral e disco voador, que foram melhor
detalhadas por meio de descrições fisiológicas (imagens videofluoroscópicas
do trato vocal) das emissões de um sujeito não cantor. A análise de imagem
do trato vocal, a partir do conjunto de medidas elencado (abertura de lábios-
absoluta e normalizada, abertura de mandíbula, distância língua-faringe,
distância língua-palato e elemento qualificador de deslocamento ântero-
posterior de língua), permitiu a associação a medidas acústicas de frequências
formânticas (F1, F2 e F3), em correspondência aos preceitos do modelo fonte-
filtro para a produção das vogais (FANT, 1960; SUNDBERG, 1979;
88
SUNDBERG, 2003), e às particularidades do canto (SUNDBERG, 1970;
SUNDBERG, 1990; MEDEIROS, 2002). Neste aspecto, os achados reforçam a
viabilidade da metodologia adotada para o aprofundamento das correlações
acústico-articulatórias no estudo da voz cantada (SUNDBERG, 1970;
SUNDBERG et al, 1987; ERICSDOTTER et al, 1998; MEDEIROS 2002;
ECHTERNACH et al, 2008; SALOMÃO, 2008; SUNDBERG, 2008; DRAHAN et
al, 2012).
6.2. Experimento 2- Análise acústica de emissões em voz cantada
(produzidas por meio de instruções baseadas em metáforas) por cantoras
e não cantoras
Este experimento concentrou-se no detalhamento dos achados
acústicos gerados por registros de emissões em voz cantada, produzidos por
meio de instruções baseadas em metáforas por cantoras e não cantoras.
Do ponto de vista dos procedimentos de análise de dados adotados, a
análise aglomerativa hierárquica de cluster aplicada ao conjunto de medidas
acústicas revelou a segregação das medidas do script ExpressionEvaluator
(f0, primeira derivada de f0, intensidade, declínio espectral e espectro de longo
termo - LTAS) numa única classe, enquanto as medidas de frequências
formânticas segregaram-se em duas outras classes, agrupando-se F1 e F2 e
separando F3 numa classe distinta. Tais achados indicaram a demanda por
abordagem diferenciada dos dados do script ExpressionEvaluator e das
medidas de formantes na interpretação dos achados, sendo tal segregação
adotada na sequência desta discussão.
89
Do ponto de vista do conjunto de medidas acústicas adotado para este
experimento, as medidas do script ExpressionEvaluator, especialmente
aquelas relativas a frequência fundamental (f0), intensidade e declínio
espectral, mostraram algum grau de diferenciação na emissão em voz cantada
produzida por meio de instruções baseadas em metáforas, quando
comparadas às emissões produzidas sem metáforas. Para o caso das medidas
de frequências formânticas das várias emissões da vogal [a], os achados do
experimento revelaram apenas variações suaves entre as diferentes metáforas.
Para o caso das medidas acústicas do script ExpressionEvaluator, as
emissões que revelaram maior diferenciação em relação às emissões sem
metáforas foram aquelas referentes à metáfora catedral, seguida da metáfora
disco voador, dados estes confirmados pela análise estatística. As medidas
que revelaram maior diferenciação entre as metáforas referiram-se àquelas
relativas à f0 (mediana e quantil 99,5%), intensidade (assimetria) e declínio
espectral (média e desvio padrão). No caso da metáfora catedral, os valores de
mediana e de quantil 99,5% de f0 foram superiores aos demais, denotando
tendência a valores habituais de f0 elevados, bem como de limite superior de
frequência atingido nas emissões. Tais dados reforçam aspectos discutidos no
experimento 1 sobre a importância do mecanismo de controle de f0 no canto
(SUNDBERG, 1970; SUNDBERG, 1982; SUNDBERG, 1990; MEDEIROS,
2002).
Para as medidas de intensidade (assimetria), os valores aumentaram
gradativamente de emissões com instruções baseadas na metáfora prisma,
para disco voador e, finalmente, catedral. Para o caso das medidas de declínio
espectral, os valores revelaram-se menores para as emissões produzidas por
90
meio da instrução baseada em metáfora catedral (portanto maior nível de
adução glótica), sendo os maiores valores detectados para as emissões sob a
instrução da metáfora disco voador (portanto, com menor força de adução
glótica). Tais aspectos também reforçam as questões de independência dos
mecanismos de pitch e loudness no canto e o fato de que o nível de loudness
total da emissão pode não corresponder diretamente ao nível de pressão
sonora da emissão, devido à importância dos ajustes de trato vocal, traduzidos
na resposta acústica de formantes (SUNDBERG, 1970; SUNDBERG, 1982;
SUNDBERG, 1990).
A análise discriminante aplicada ao conjunto de medidas acústicas
(script ExpressionEvaluator e frequências formânticas) para estimação da
possibilidade de segregação das emissões produzidas por meio de instruções
baseadas em metáforas, revelou poder segregatório parcial (40 a 66,67%)
para a metáfora catedral – o maior índice, e o menor para prisma, em que
exerceram influência, em ordem descrescente, as medidas de declínio
espectral, de intensidade, de frequência formântica - F1 e de f0.
Quando consideradas somente as medidas geradas pelo script
ExpressionEvaluator, o poder segregatório foi, novamente, similar, entre 26%
a 60%, sendo o maior valor para a metáfora catedral, com influência, em
ordem descrescente, de medidas de declínio espectral , f0 e de intensidade.
Consideradas de forma isolada, as medidas de frequências formânticas
revelaram menor poder segregatório para estimação das metáforas (entre 26%
para disco voador e 46,6% para emissões sem metáfora), revelando que foram
menos sensíveis para detectar diferenças entre as várias emissões produzidas.
91
A partir da análise acústica das emissões estudadas no experimento 2,
foi possivel assinalar que as medidas de declínio espectral, intensidade e f0
foram mais sensíveis para a descrição das emissões em voz cantada
estudadas.
A partir destes achados, consideramos relevante ao estudo investigar as
particularidades dos grupos de informantes cantoras e não cantoras, a fim de
se estimar se a experiência em canto afetaria o uso do trato vocal para a
solicitacão específica da emissão em voz cantada.
Desta maneira, foram detectadas diferenças estatisticamente relevantes
tanto para as medidas do script ExpressionEvaluator, quanto de frequências
formânticas quando comparados os grupos de cantoras e não cantoras.
Quanto ao script ExpressionEvaluator, as cantoras apresentaram emissões em
voz cantada cujos valores de f0 (mediana, quantil 99,5% e assimetria) e de
intensidade (assimetria) revelaram-se elevados em relação às não cantoras.
Os valores de primeira derivada de f0 revelaram-se mais deslocados para
valores negativos no caso das não cantoras. Neste aspecto, há indícios de
variações menos suaves de f0, portanto mais abruptas (BARBOSA, 2009) para
as não cantoras. Tais dados sinalizam a demanda por controle de f0 e revelam
que se trata de um mecanismo complexo, em que interagem aspectos
fonatórios e de dinâmica respiratória (SUNDBERG, 1990). A demanda por
controle de f0 é muito refinada no canto, sendo que Sundberg (1975, 1989) e
Sundberg et al (1989) relataram que o efeito da pressão subglótica, pelo efeito
denominado tracheal pull (descida da laringe que ocorre em sincronia com o
movimento da respiração-inspiração) afeta f0 e que, no canto este controle é
decisivo, inclusive para se atingir os picos de f0.
92
Tais dados foram confirmados em série de estudos posteriores sobre os
efeitos do tracheal pull e reforçam a demanda por indepedência de f0 e
intensidade no plano acústico (SUNDBERG et al, 1989; SUNDBERG, 1992;
VILKMAN et al, 1996; IWARSSON et al, 1998; IWARSSON, 2001). Na fala, tal
indepedência não é necessária. Os dados das não cantoras deste estudo
revelam que tal dependência ainda parece não ocorrer, especialmente pela
congruência de medidas de f0, intensidade e declínio espectral.
Quanto aos valores de frequências formânticas, as não cantoras
revelaram valores elevados de F1, F2 e F3 quando comparados às cantoras.
Tais achados sinalizam tendência a encurtamento do trato vocal. Somados aos
dados de f0, estes dados sinalizam tendências à elevação de laringe e
aumento de tensão glótica (SUNDBERG, 1990).
Da mesma forma, a análise discriminante de medidas acústicas, tanto do
script ExpressionEvaluator, quanto de frequências formânticas, revelou poder
segregatório das emissões dos grupos cantoras e de não cantoras. Quando
consideradas as medidas do script ExpressionEvaluator, o poder segregatório
de emissões de cantoras atingiu 90% contra 85% das não cantoras. Foram
relevantes, em ordem descrescente de influência, as medidas de f0 (quantil
99,5%, semiamplitude entre quartis e mediana) e de intensidade (assimetria).
Quando analisadas as medidas de frequências formânticas, os valores foram
ligeiramente inferiores, com 75% de identificação das emissões de cantoras e
78,33% de não cantoras, com influência dos valores de frequências
formânticas- F2. Tais achados sinalizam que o controle de f0 e de intensidade
influenciam de forma considerável a diferenciação da voz de cantoras e não
cantoras.
93
A prontidão é definida como o estado do que está pronto ou a agilidade/
rapidez de compreensão/ execução de alguma atividade (AULETE, 2007). O
índice é gerado por meio do script ExpressionEvaluator, com base na variação
de f0 e de ênfase espectral (BARBOSA, 2009). A prontidão tende a aumentar
de forma proporcional à quantidade de declínios de f0 detectados no trecho
analisado, e de forma inversamente proporcional à média de ênfase espectral.
Em relação à analise do parâmetro de prontidão pelo script
ExpressionEvaluator, foram detectadas correlações especialmente aos valores
de medidas acústicas de declínio espectral (média, desvio padrão e
assimetria).
De forma mais detalhada, destacamos que a análise de regressão linear
aplicada aos dados de prontidão revelou 98% de correlação aos dados das
medidas acústicas do script ExpressionEvaluator, com destaque para aquelas
de declínio espectral (média, desvio padrão e assimetria) e de LTAS (desvio
padrão). Tais dados estão em conformidade com as diretrizes do script
ExpressionEvaluator (BARBOSA, 2009), em que a ênfase espectral é tida
como um dos parâmetros de relevância à determinação do grau de prontidão.
Quando aplicado aos dados de frequências formânticas, o grau de
correlação foi menor (68,2%) para prontidão, destacando-se a relevância de
F1. Quando consideradas em conjunto (script ExpressionEvaluator e
frequências formânticas), a correlação atingiu 99% com maior influência das
medidas de declínio espectral e de LTAS.
Para finalizar a discussão dos dados de prontidão, a análise de
regressão linear de prontidão e de variáveis qualitativas, como grupo de
informantes (cantoras e não cantoras), sujeito e instrução por metáforas,
94
revelou maior valor de correlação para sujeito estudado (75,6%), enquanto
para instrução o valor foi de 5,2% e de apenas 0,5% para grupo (cantoras e
não cantoras). Tais dados reforçam que a prontidão pode ser um parâmetro
para se estimar os efeitos indivualizados do uso de metáforas na situação de
ensino de canto.
O índice de prontidão integra o tripé tridimensional da veiculação de
afeto na fala, juntamente a prazer e poder, destacando-se, como correlatos
acústicos, valores médios de f0 e intensidade, além de extensão de f0
(PEREIRA, 2000). As referências às correlações de f0 e de intensidade
também são sustentadas por Johnstone e Scherer (1999).
Além disso, Johnstone e Scherer (1999) referiram efeitos de outras
medidas acústicas na análise de aspectos acústicos da prontidão e reforçam
que as correlações à medida de extensão de f0 seriam, ainda, controversas.
Outros índices referidos são o coeficiente de fechamento glótico (no plano
fisiológico- eletroglotografia), sendo que o aumento de f0 e de intensidade
seriam proporcionais ao índice de esforço vocal, dados concordantes com
nossos achados em termos de correlação de prontidão a medidas de declínio
espectral.
Diante das questões de pesquisa elencadas na introdução do presente
estudo, podemos destacar que os achados do experimento 2 sinalizam que o
uso das metáforas para o ensino do canto propicia mobilizações diferenciadas
do trato vocal na produção vocal, passíveis de detecção por meio de
descrições acústicas, especialmente pelas medidas de f0, intensidade e
declínio espectral. Tais mobilizações foram detectadas em cantoras e não
95
cantoras, sendo que algumas medidas acústicas revelaram diferenças entre os
dois grupos, tais como f0, intensidade e frequências formânticas.
6.3. Abordagem integrada- experimentos 1 e 2
Neste ponto do trabalho, cabe a retomada da abordagem dos efeitos do
uso das metáforas na voz cantada que possam permitir a finalização da
discussão, com base na integração de dados dos dois experimentos.
Diante dos dados de experimentos de natureza acústica e articulatória,
foi possível estimar algumas ações sob as quais o trato vocal dos indivíduos
avaliados foi submetido nas situações de instruções baseadas em metáforas
para a emissão de voz cantada. Os dados apresentados permitem discutir
aspectos que permeiam os estudos do simbolismo sonoro (HINTON et al,
1994; FONAGY, 2000; MADUREIRA, 2005) e do aprendizado do canto, no
sentido de colaborar para a compreensão de particularidades do processo de
ensino e prática do canto.
Dessa forma, os achados detalhadamente expostos e discutidos tornam
possível inferir os níveis de mobilização das estruturas do trato vocal diante do
estímulo das metáforas. Destacamos que as medidas de imagem do trato
vocal, bem como as medidas acústicas de frequências formânticas foram
relevantes no experimento 1, enquanto as medidas acústicas relativas a f0,
intensidade e declínio espectral foram relevantes para a discussão dos dados
do experimento 2.
Da combinação dos dois experimentos, foi possível destacar o esboço
das configurações do trato vocal diante de emissões produzidas por meio de
96
instruções baseadas em metáforas nos experimentos 1 (análise articulatória e
acústica) e 2 (análise acústica).
Conforme salientou Sundberg (1990), aprender a cantar significa
estabelecer novos padrões para respiração, articulação e fonação e, para
tanto, o aconselhamento de profissional, professor de canto, habilidoso e
conhecedor do campo é fundamental. Neste ponto, as metáforas são
amplamente utilizadas como estratégia na pedagogia vocal (AGUIAR, 2007;
CLEMENTS, 2008; SOUSA et al, 2010; ROSSBACH, 2011).
A retomada da importância do aconselhamento dos cantores, aliada aos
aspectos das relações som e sentido levou-nos a estimar alguns efeitos no
trato vocal a partir das metáforas utilizadas como instruções neste estudo,
baseando-nos, inclusive, nas figuras utilizadas nas instruções (anexo 4):
Metáfora catedral (metáfora que mais se diferenciou das demais
emissões)
o Imagem videofluoroscópica do trato vocal- maior grau de
abertura de lábios e de mandíbula, expansão faríngea,
língua em posição centralizada (posteriorizada nas vogais
anteriores e anteriorizada para vogais posteriores);
o Dados acústicos: rebaixamento de frequências formânticas
(F1 e F2) e padrão variável de valores de F3. Script
ExpressionEvaluator: valores de mediana e de quantil
99,5% de f0 superiores às demais metáforas, assim como
de intensidade (assimetria). Os valores de declínio
espectral apresentaram-se rebaixados (maior nível de
adução glótica);
97
o Associação à ilustração da metáfora: ângulo de visão-
interior do trato vocal- a entrada de luz na parte superior
guarda relação com a abertura na extremidade do trato
vocal- mandíbula e lábios (por onde entra luz na cavidade-
à semelhança do efeito de abertura de boca para
cavidades oral e orofaríngea). O diâmetro da cúpula
remete à amplitude da cavidade faríngea- tendência à
expansão.
Metáfora Prisma
o Imagem videofluoroscópica do trato vocal - maior grau de
abertura de lábios, sem correspondente em termos da
abertura de mandíbula, postura de língua elevada, menor
amplitude de faringe;
o Dados acústicos: frequências formânticas similares às
emissões produzidas sem instruções baseadas em
metáforas; Script ExpressionEvaluator: valores
intermediários de f0, menores medidas de intensidade
(assimetria), com valores intermediários de declínio
espectral;
o Associação à ilustração da metáfora - vista anterior do trato
vocal: progressivamente mais fechado na porção superior,
com menor grau de abertura de mandíbula-constrição
faríngea. Esta metáfora revelou mais efeitos de ação de
lábios, o que poderia ser relativo ao efeito de radiação dos
98
lábios na teoria acústica (SUNDBERG, 1997), que
combinaria com o feixe de cores presente no desenho.
Metáfora disco voador
o Imagem videofluoroscópica do trato vocal - menor grau de
abertura de lábios e de mandíbula, língua elevada e
expansão faríngea;
o Dados acústicos- F1 e F2 revelaram tendência a
rebaixamento de frequência para a maioria das vogais, e
padrão variável de valores de F3. Script
ExpressionEvaluator: valores intermediários de f0 e de
intensidade (assimetria); valores elevados de declínio
espectral (menor nível de adução glótica);
o Associação à ilustração da metáfora - vista anterior do trato
vocal, com maior dimensão em termos de diâmetro
(compatível com expansão faríngea) e menor em termos
de comprimento (lábios e mandíbula).
Tais achados remetem a Fonagy (1976), que relatou associação de
padrões de movimentação de língua e de abertura de boca a diferentes
estados emocionais e atitudes na fala. Pautou tais descrições em investigações
fisiológicas dos planos articulatório e fonatório.
Sundberg (1982), ao discutir aspectos da voz, canto e emoção, retomou
fundamentos de Fonagy (1976) assumindo a língua como uma “seta (flecha)”
entre pontos articulatórios, o que sinalizaria a ação do articulador – a língua-
99
com uma possível relação para o comportamento simbólico. Destacou que a
linguagem corporal geral das emoções poderia explicar a influência das
emoções sobre a ação dos órgãos vocais.
Além disso, pensando em efeitos figurativos, é possível trazer à tona, as
figuras utilizadas para a composição dessa pesquisa (anexo 4). Todas elas
apresentam uma imagem/significado pré-estabelecido, todavia, durante a
produção de voz cantada as figuras apresentam um papel corporal, ou seja,
propiciam diferentes ajustes de trato vocal. Portanto, criou-se uma nova
representação simbólica que impactou a produção vocal do sujeito informante,
visto que encontramos diferentes ajustes de lábios, mandíbula, postura de
língua e constrição/expanão faríngea para cada tipo de imagem visualizada
(diferentes sensações corporais, sinestésicas e metalinguísticas) (HINTON et
al, 1994; FONAGY, 2000)
Os dados aqui relatados reforçam que cada participante (cantora e não
cantora) mobilizou o trato vocal para diferenciar ações que revelam o elo
indissociável entre som e sentido e reforçam as questões de base dos estudos
do simbolismo sonoro (HINTON et al, 1994), na busca por produzir emissões
em voz cantada a partir de diferentes instruções.
O conceito da metáfora sonora (FONAGY, 1983) remete justamente às
relações entre som e sentido. Tais relações pautam-se em cinco categorias de
simbolismo; corporal, imitativo; sinestésico, metalinguístico e convencional
(HINTON et al, 1994), sendo que para o uso das instruções para o canto,
destacou-se o simbolismo sinestésico, quando consideramos o detalhamento
de cada metáfora acima esboçado, em que as propriedades sonoras são
100
empregadas para representar propriedades visuais, táteis e proprioceptivas de
objetos.
As metáforas podem ajudar na implementação de ajustes do trato vocal
do cantor, e do estudante de canto, levando-se em conta vários fatores que
envolvem e permeiam a pedagogia vocal nesta situação particular e fascinante
do canto.
101
7. CONCLUSÃO
A análise fonética dos dados revelou que as metáforas geraram
mobilizações diferenciadas no trato vocal, especialmente para “catedral” e
“disco voador”, reveladas por meio de descrições articulatórias- imagens
videofluoroscópicas (medidas de abertura de lábios, abertura de mandíbula,
distância língua-faringe, distância língua-palato e elemento qualificador de
deslocamento ântero-posterior de língua) e acústicas (f0, intensidade e declínio
espectral).
Tais mobilizações revelaram diferenças quando comparados os grupos
de cantoras e não cantoras, especialmente em termos das medidas acústicas
de f0, intensidade e frequências formânticas (F1, F2 e F3).
As correspondências entre achados acústicos e de imagem do trato
vocal foram relevantes à investigação da produção de voz cantada e
reforçaram a importância do enfoque das relações entre som e sentido,
especialmente mediadas pelas questões do simbolismo sonoro sinestésico.
102
8. Anexos
Anexo 1
Termo de Consetimento Livre e Esclarecido (experimento 1)
Nome do(a) Participante: ___________________________________Data:_______________ Endereço: ___________________ ___________________________Cidade:_____________ Estado:____________CEP:________________Telefone: ( )___________R.G.:___________ CPF:___________________E-mail: ______________________________________________ Nome da Pesquisadora Principal: Cristina Canhetti Alves Instituição: LIAAC-PUCSP Título do estudo: Ajustes articulatórios no ensino do canto lírico: dados acústicos e de imagem do trato vocal Propósito do estudo: Análise do trato vocal supraglótico por meio de imagens videofluoroscópicas e análise acústica de amostras de voz cantada. Procedimentos: Participarei de uma gravação de amostras de voz cantada, por meio da técnica de videofluoroscopia. Serei previamente orientado pelo pesquisador que efetuará a coleta. Cantarei trecho de música que me será previamente apresentado, de acordo com instruções específicas para modificações da voz, tais como “projetar a voz como numa catedral”, “deixar a voz flutuar”, “espalhar a voz como a luz refletida num prisma”.
1- Riscos e desconfortos: Avisar imediatamente o pesquisador em caso estar no período gestacional ou qualquer dúvida a respeito. Em caso de gravidez ou suspeita, não será realizada a gravação, devido a exposição à radiação.
2- Benefícios: Minha participação é voluntária e não trará qualquer benefício direto, mas proporcionará um melhor conhecimento sobre os ajustes do trato supraglótico durante o canto pelo uso de metáforas sonoras, como também para futuros estudos na área de canto.
3- Direitos do participante: Eu posso me retirar desse estudo a qualquer momento, sem sofrer nenhum prejuízo e tenho direito de acesso, em qualquer etapa do estudo, sobre qualquer esclarecimentos de eventuais dúvidas.
4- Compensação financeira: Não existirão despesas ou compensações financeiras relacionadas à minha participação no estudo.
5- Incorporação ao banco de dados do LIAAC: Os dados obtidos com minha participação, na forma de gravação de imagens serão incorporados ao banco de dados do LIAAC, cujos responsáveis zelarão pelo uso e aplicabilidade das amostras exclusivamente para fins científicos, apenas consentindo o seu uso futuro em projetos que atestem pelo cumprimento dos preceitos éticos em pesquisa envolvendo seres humanos. Algumas amostras poderão ser usadas em publicação referente ao modelo, sem que haja identificação do falante e sem que seus direitos sejam atingidos.
6- Em caso de dúvida quanto ao item 8, posso entrar em contato com os responsáveis pelo banco de dados do LIAAC ( Profa. Dra. Sandra Madureira, Profa. Dra. Zuleica Camargo, e Prof. Mário Fontes no telefone (11)3670-8333.
7- Confidencialidade: Compreendo que os resultados deste estudo poderão ser publicados em jornais profissionais ou apresentados em congressos profissionais, sem que minha identidade seja revelada.
8- Se tiver dúvida quanto a pesquisa descrita posso telefonar para a pesquisadora Zuleica Camargo no número (11)3670-8333 a qualquer momento.
Eu compreendo meus direitos como um sujeito de pesquisa e voluntariamente consisto em participar deste estudo e em ceder meus dados para o banco de dados do LIAAC. Compreendo sobre o que, como e porque este estudo está sendo feito. Receberei uma cópia assinada deste formulário de consentimento. ___________________________________ Data: ________________ Assinatura do sujeito participante ___________________________________ Assinatura do pesquisador
103
Anexo 2
Termo de Consetimento Livre e Esclarecido (experimento 2)
Nome do(a) Participante: ____________________________________Data:_______________
Endereço: ________________________________________________Cidade:_____________
Estado:____________CEP:_____________Telefone: ( )_____________R.G.:___________
CPF:___________________E-mail: ______________________________________________
Nome da Pesquisadora Principal: Cristina Canhetti Alves
Instituição: LIAAC-PUCSP
Título do estudo: Ajustes articulatórios no ensino do canto lírico: dados acústicos e de imagem do
trato vocal
Propósito do estudo: Análise do trato vocal supraglótico por meio de imagens videofluoroscópicas e
análise acústica de amostras de voz cantada.
Procedimentos: Participarei de uma gravação de amostras de voz cantada, no Laboratório de Rádio
da PUC-SP. Serei previamente orientado pelo pesquisador que efetuará a coleta. Cantarei trecho de
música que me será previamente apresentado, de acordo com instruções específicas para
modificações da voz, tais como “projetar a voz como numa catedral”, “deixar a voz flutuar”, “espalhar
a voz como a luz refletida num prisma”.
1- Riscos e desconfortos: nenhum
2- Benefícios: Minha participação é voluntária e não trará qualquer benefício direto, mas
proporcionará um melhor conhecimento sobre os ajustes do trato supraglótico durante o
canto pelo uso de metáforas sonoras, como também para futuros estudos na área de canto.
3- Direitos do participante: Eu posso me retirar desse estudo a qualquer momento, sem sofrer
nenhum prejuízo e tenho direito de acesso, em qualquer etapa do estudo, sobre qualquer
esclarecimentos de eventuais dúvidas.
4- Compensação financeira: Não existirão despesas ou compensações financeiras
relacionadas à minha participação no estudo.
5- Incorporação ao banco de dados do LIAAC: Os dados obtidos com minha participação, na
forma de gravação de imagens serão incorporados ao banco de dados do LIAAC, cujos
responsáveis zelarão pelo uso e aplicabilidade das amostras exclusivamente para fins
científicos, apenas consentindo o seu uso futuro em projetos que atestem pelo cumprimento
dos preceitos éticos em pesquisa envolvendo seres humanos. Algumas amostras poderão
ser usadas em publicação referente ao modelo, sem que haja identificação do falante e sem
que seus direitos sejam atingidos.
6- Em caso de dúvida quanto ao item 8, posso entrar em contato com os responsáveis pelo
banco de dados do LIAAC ( Profa. Dra. Sandra Madureira, Profa. Dra. Zuleica Camargo, e
Prof. Mário Fontes no telefone (11)3670-8333.
7- Confidencialidade: Compreendo que os resultados deste estudo poderão ser publicados em
jornais profissionais ou apresentados em congressos profissionais, sem que minha
identidade seja revelada.
8- Se tiver dúvida quanto a pesquisa descrita posso telefonar para a pesquisadora Zuleica
Camargo no número (11)3670-8333 a qualquer momento.
Eu compreendo meus direitos como um sujeito de pesquisa e voluntariamente consisto em
participar deste estudo e em ceder meus dados para o banco de dados do LIAAC. Compreendo
sobre o que, como e porque este estudo está sendo feito. Receberei uma cópia assinada deste
formulário de consentimento.
___________________________________ Data: ________________
Assinatura do sujeito participante
___________________________________
Assinatura do pesquisador
105
Anexo 4
Figuras ilustrativas das metáforas utilizadas como base das instruções
para emissões em voz cantada
Metáfora Prisma:
Metáfora Catedral:
Metáfora Disco Voador:
106
Anexo 5
Tutorial para Conversão de um arquivo para o formato. pap
1- Abra o item Meu Computador. Em seguida, clique no item Organizar e
por fim clicar em Opções de pastas e pesquisa (figura 35). Após esse
procedimento abrirá uma nova janela, clique na aba Modo de Exibição e
não deixe selecionada a opção Ocultar as extensões dos tipos de
arquivos conhecidos (figura 36).
Figura 35. Localização
visual dos itens Meu
Computador, Organizar e
Opções de pastas como
procedimento para
mudança de extensão de
arquivo
Figura 36. Localização visual dos itens
Opções de Pasta, Modo de Exibição e
item que não deve ser selecionado
como procedimento para mudança de
extensão de arquivo
2- A partir dessa seleção, todos arquivos existentes no computador
aparecerão com a extensão do arquivo em evidência. Crie uma cópia do
arquivo para impedir que haja perda após a alteração de sua extensão.
Após tal procedimento, clique no arquivo cópia com o botão direito do
107
mouse, selecione renomear. Em seguida, renomeie cópia do arquivo e
troque a extensão original pela extensão pap. Nesse momento,
aparecerá uma mensagem confirmando a alteração que será realizada,
clique no botão “sim” (figura 37) e será gerado o arquivo com a extensão
pap, que ficará em branco (figura 38).
Figura 37. Mensagem de confirmação para
modificação da extensão do arquivo
selecionado
Figura 38. Arquivo cópia
renomeado com a extensão
pap
3- Após esse procedimento, transfira o arquivo com a extensão pap para a
pasta de imagens do software Osiris. Abra o programa Osiris e abra o
arquivo que será utilizado para a análise de imagens (figura 39). Assim
que a imagem for aberta, clique no item “File” e na opção “Save as
Papyrus” (figura 40). Abrirá uma janela para que a imagem seja salva.
Sugerimos colocar o mesmo nome, porém acrescente a palavra Osiris,
para que fique fácil identificar o arquivo transformado na extensão
papyrus (figura 41). Ao final, aparecerá uma mensagem para abrir o
arquivo gerado (figura 42). Nesse momento, será possível utilizar todas
as ferramentas no software Osiris.
108
Figura 39. Localização do
arquivo no software Osiris
Figura 40. Instrução de como salvar o
arquivo em papyrus
Figura 41. Renomear o arquivo
que será salvo como papyrus
Figura 42. Gerar o arquivo papyrus e
iniciar a análise dos dados pelo
software Osiris
109
Anexo 6
INFORMAÇÕES SOBRE PROCEDIMENTOS DE ANÁLISE
ESTATÍSTICA ADOTADOS NA PESQUISA:
Descrição sobre software utilizado: XLSTAT (2012 por Addinsoft SARL, Paris,
França), compatível com todas as versões do software Microsoft Excel. Versão
funcional encontra-se no site www.xlstat.com, com acesso livre por 30 dias.
Procedimentos de análise:
As informações foram consultadas em manual de instruções do software
XLSTAT.
1. TESTE DE CORRELAÇÃO DE PEARSON
Teste de coeficiente de correlação proposto para calcular a correlação
entre um conjunto de variáveis quantitativas, contínuas, discretas ou ordinais
(neste último caso, as classes devem ser representadas por valores que
respeitam a ordem).
Alguns dos possíveis resultados:
Coeficiente de correlação de Pearson: corresponde ao coeficiente
de correlação linear clássico. Este coeficiente é bem adequado
para os dados contínuos. O seu valor varia entre -1 e 1 e mede o
grau de correlação linear entre duas variáveis.
Nota: o coeficiente de correlação de Pearson ao quadrado dá uma idéia de como parte da variabilidade de uma variável é explicada pela outra variável. Os valores de p que são computados para cada coeficiente permitem testar a hipótese nula, ou seja, hipótese de que os coeficientes não são significativamente diferentes de 0. No entanto, é preciso ter cuidados na
110
interpretação dos resultados, pois, como duas variáveis são independentes, seu coeficiente de correlação é zero, mas o inverso não é verdadeiro.
A matriz de correlação e a tabela dos valores de p são exibidos nos
resultados. Os mapas de correlações, que permitem identificar potenciais
estruturas de matriz, são capazes de identificar rapidamente as correlações
mais interessantes.
Bibliografia:
BEST, D.J.; ROBERTS, D.E. Algorithm AS 89: The upper tail probabilities of
Spearman's rho. Applied Statistics, 1975, n.24, p.377–379.
BEST, D.J.; GIPPS, P.G. Algorithm AS 71, Upper tail probabilities of Kendall's tau.
Applied Statistics, 1974, n.23, p.98-100.
HOLLANDER, M.; WOLFE, D.A. Nonparametric Statistical Inference. John Wiley &
Sons, New York, 1973.
KENDALL, M. Rank Correlation Methods. Charles Griffin and Company, London, 2nd
ed, 1955.
LEHMANN, E.L. Nonparametrics: Statistical Methods Based on Ranks. Holden-Day,
San Francisco, 1975.
2. ANÁLISE FATORIAL
Realizada sempre que se deseja investigar a existência de fatores
subjacentes comuns às variáveis quantitativas medidas em um conjunto de
observações. Atualmente, existem dois tipos principais de análise fatorial:
análise fatorial exploratória e análise fatorial confirmatória, sendo a primeira
utilizada pelo software XLSTAT e descrita a seguir.
A análise fatorial é um método que revela a possível existência de
fatores subjacentes que dão uma visão geral da informação contida numa
grande quantidade de variáveis investigadas. A estrutura que liga os fatores às
variáveis é inicialmente desconhecia e apenas o número de fatores pode ser
111
assumido. Os possíveis resultados encontrados a partir dessa análise referem-
se a:
Estatística descritiva: apresenta as estatísticas simples para todas as
variáveis selecionadas, incluindo o número de observações, o número
de valores faltantes, o número de valores não ausentes, a média e o
desvio padrão;
Matriz de correlação/Covariância: apresenta os dados que serão
posteriormente utilizados nos cálculos. O tipo de correlação depende da
opção escolhida na guia "Geral" na caixa de diálogo.
Medida da adequabilidade da amostra por Kaiser-Meyer-Olkin (KMO):
apresenta o valor da medida de KMO para cada variável individual e a
medida KMO global. A medida KMO varia entre 0 e 1. Um valor baixo
corresponde ao caso em que não é possível extrair fatores sintéticos (ou
variáveis latentes). Em outras palavras, a amostra seria "insuficiente".
Kaiser (1974) recomenda não aceitar um modelo se o fator de KMO for
inferior a 0,5. Se a KMO situar-se entre 0,5 e 0,7, a qualidade da
amostra é ainda precária. A qualidade da amostra passa a ser boa para
um KMO entre 0,7 e 0,8, muito boa entre 0,8 e 0,9 e, acima, é tida como
excelente;
Alfa de Cronbach: se esta opção for ativada, o valor de Alfa de Cronbach
é exibido;
Variação da máxima comunalidade em cada iteração: apresenta a
variação máxima da comunalidade das últimas 10 interações. Para o
método de máxima verossimilhança, a evolução do critério, que é
proporcional ao inverso do máximo da probabilidade, também é exibida;
112
Bondade de teste de ajuste: a bondade de teste de ajuste só é exibida
quando o método de máxima verossimilhança for escolhido;
Matriz de correlação reproduzida: produto da matriz das cargas fatoriais
pela sua transposta;
Matriz de correlação residual: calculada como a diferença entre a matriz
de correlações variáveis e a matriz de correlação reproduzida;
Autovalores: apresenta os autovalores associados aos vários fatores em
conjunto com as porcentagens correspondentes e porcentagens
cumulativas;
Autovetores: apresenta os autovetores;
Fator padrão: apresenta as cargas fatoriais (coordenadas de variáveis
no espaço vetorial, também chamados de fator padrão). O gráfico
correspondente é exibido;
Correlações Fator / Variável: apresenta as correlações entre os fatores e
variáveis;
Coeficientes fatoriais padronizados: apresenta os coeficientes fatoriais
padronizados a exibir. Multiplicando as coordenadas (padronizadas) das
observações no espaço inicial por esses coeficientes, são obtidas as
coordenadas das observações no espaço de fatores;
Estrutura de fatores: apresenta as correlações entre os fatores e
variáveis após a rotação no espaço dos fatores
Bibliografia:
CATTELL, R.B. The scree test for the number of factors. Multivariate Behavioral
Research, 1966, n.1, p. 245-276.
CRAWFORD, C.B.; FERGUSON, G.A. A general rotation criterion and its use in
orthogonal rotation. Psychometrika, 1970, vol.35, n.3, p.321-332.
113
CURETON, E.E.; MULAIK, S.A. The weighted Varimax rotation and the Promax
rotation. Psychometrika, 1975, vol.40, n.2, p.183-195.
KAISER, H.F. An index of factorial simplicity. Psychometrika, 1974, vol.39, n.1, p.31-
36.
JENNRICH, R.I.; ROBINSON, S.M. A Newton-Raphson algorithm for maximum
likelihood factor analysis. Psychometrika, 1969, vol.34, n.1, p.111-123.
JÖRESKOG, K.G. Some Contributions to Maximum Likelihood Factor Analysis.
Psychometrika, 1967, vol.32, n.4, p.443-481.
JÖRESKOG, K.G. Factor Analysis by Least-Squares and Maximum Likelihood
Methods, in Statistical Methods for Digital Computers, eds. ENSLEIN, K.; RALSTON,
A.; WILF, H.S. John Wiley & Sons, New York, 1977.
LAWLEY, D.N. The estimation of factor loadings by the Method of maximum likelihood.
Proceedings of the Royal Society of Edinburgh. 1940, 60, 64-82.
LOEHLIN, J.C.Latent Variable Models: an introduction to factor, path, and structural
analysis. LEA, Mahwah, 1998.
MARDIA, K.V; KENT, J.T.; BIBBY, J.M. Multivariate Analysis. Academic Press,
London, 1979.
SPEARMAN, C. General intelligence, objectively determined and measured. American
Journal of Psychology, 1904, vol.15, p.201-293.
3. ANÁLISE AGLOMERATIVA HIERÁRQUICA DE CLUSTER
Utiliza-se a análise aglomerativa hierárquica de cluster para descrever
grupos homogêneos de objetos (classes) com base em um conjunto de
variáveis, ou a partir de uma matriz que descreve a semelhança ou
dissemelhança entre os objetos.
Esse método de classificação trabalha a partir das diferenças entre os
objetos a serem agrupados. Um tipo de dissimilaridade pode ser escolhido, que
é adequado para o objeto estudado e a natureza dos dados.
Um dos resultados desse método é o dendrograma, que mostra o
agrupamento progressivo dos dados. Por meio do dendrograma é possível
114
estimar um número apropriado de classes em que os dados podem ser
agrupados. Sua desvantagem refere-se ao processamento demorado e, além
disso, o dendrograma pode se tornar ilegível se forem utilizados muitos dados.
Princípio do Agrupamento Hierárquico Aglomerativo (AHC):
É um método interativo de classificação cujo princípio é simples: o
processo começa com o cálculo da dissimilaridade entre os “n” objetos. Em
seguida, dois objetos são agrupados de forma a minimizar o critério de
aglomeração adotado. Estando agrupados, cria-se uma classe que inclui esses
dois objetos. Em seguida, a dissimilaridade entre esta classe e os objetos é
calculada usando o critério de aglomeração. Os dois objetos ou classes de
objetos, cujo agrupamento minimiza o critério de aglomeração, são então
agrupados. Este processo continua até que todos os objetos sejam agrupados.
Estas operações sucessivas de agrupamento produzem uma árvore de
agrupamento binário (dendrograma), cuja raiz é a classe que contém todas as
observações. Isto representa um dendrograma hierárquico de clusters.
Em seguida, é possível escolher uma partição truncando a árvore em um
determinado nível. Tal nível depende tanto das restrições definidas pelo
usuário como de critérios mais objetivos.
Os resultados encontrados para esta análise são:
Resumo de parâmetros estatísticos: apresenta, para os
descritores dos objetos, o número de observações, o número de
valores faltantes, o número de valores não faltantes, a média e o
desvio padrão;
115
Estatísticas de nós: mostra os dados para os nós sucessivos no
dendrograma. O primeiro nó tem um índice que é o aumento do
número de objetos. Por isso, é fácil de observar, a qualquer
momento, se um objeto ou grupo de objetos é agrupado com
outro objeto ou grupo de objetos no nível de um novo nó no
dendrograma;
Gráfico de barras de níveis: apresenta as estatísticas para os nós
do dendrograma;
Dendrogramas: o dendrograma completo exibe o agrupamento
progressivo de objetos. Se o truncamento foi solicitado, uma linha
tracejada representa o nível do truncamento que foi realizado.
Dessa forma, o dendrograma truncado mostra as classes após o
truncamento;
Classe de Centróides: mostra os centróides de classe para os
diferentes descritores;
Distância entre as classes de centróides: mostra as distâncias
euclidianas entre os centróides de classe para os diferentes
descritores;
Objetos centrais: mostra as coordenadas do objeto mais próximo
ao centróide para cada classe;
Distância entre os objetos centrais: mostra as distâncias
euclidianas entre os objetos de classe centrais para os diferentes
descritores;
116
Resultados por classe: as estatísticas descritivas para as classes
(número de objetos, soma dos pesos dentro da classe de
variância, distância mínima para a distância, centróide máximo
para o baricentro, distância média para o centróide) são exibidos
na primeira parte da tabela.
Resultados por objeto: mostra a classe de atribuição para cada
objeto em sua ordem inicial.
Bibliografia:
ARABIE, P.; HUBERT, L.J.; DE SOETE, G. Clustering and Classification. Wold
Scientific, Singapore, 1996.
EVERITT, B.S.; LANDAU, S.; LEESE, M. Cluster analysis. Arnold, 4th ed, London,
2001.
JOBSON, J.D.; Applied Multivariate Data Analysis in Categorical and Multivariate
Methods. Springer-Verlag, New York, 1992, vol.2, p. 483-568.
LEGENDRE, P.; LEGENDRE, L. Numerical Ecology. Elsevier, 2nd ed, Amsterdam,
1998, p.403-406.
SAPORTA, G. Probabilités, Analyse des Données et Statistique. Technip, Paris, 1990,
p.251-260.
WARD, J.H. Hierarchical grouping to optimize an objective function. Journal of the
American Statistical Association, 1963, vol.58, p.238-244.
4. ANÁLISE DE CORRELAÇÃO CANÔNICA
A análise de correlação canônica é um dos muitos métodos que
permitem estudar a relação entre dois conjuntos de variáveis. Desenvolvido por
Hotelling (1936), este método é muito usado em ecologia.
Utiliza-se a análise de correlação canônica para estudar a correlação
entre dois conjuntos de variáveis e para extrair dessas tabelas um conjunto de
117
variáveis canônicas que estão, tanto quanto possível, correlacionadas com
ambas as tabelas, ortogonais entre si.
Assume-se que Y1 e Y2 são duas tabelas, com, respectivamente, p e q
sendo suas variáveis. A análise de correlação canônica visa à obtenção de dois
vetores a(i) e b(i) tal que seja maximizada a relação. Devem ser introduzidas
restrições de modo que a solução para a(i) e b(i) seja única. À medida que se
tentam maximizar a covariância entre Y1A (i) e Y2b (i) e minimizar a sua
respectiva variação, pode-se obter os componentes que são melhor
correlacionados entre si. Uma vez que a solução tenha sido obtida para i = 1,
procura-se pela solução para i = 2, onde a (2) e b (2) deve ser,
respectivamente, ortogonal a um (1) e b (2), e assim por diante. O número
máximo de vetores que pode ser extraído é igual a min(p, q).
A análise de Tucker (1958) é uma alternativa em que se pretende
maximizar a covariância entre os componentes Y1a(i) e Y2b(i).
Em relação aos resultados, é possível observar:
Resumo das Estatísticas: apresenta as estatísticas descritivas
para os objetos e as variáveis explicativas;
Matriz de similaridade: matriz que corresponde ao "tipo de
análise" escolhido na caixa de diálogo;
Autovalores e porcentagens de inércia: apresenta os auto-valores,
a inércia correspondente, e as percentagens correspondentes;
Nota: em alguns softwares, os auto-valores que são exibidos são igual a L / (1-
L), onde L é o autovalor dado pelo XLSTAT.
118
Lambda de Wilks: permite determinar se os dois grupos Y1 e Y2
estão significativamente relacionados com cada variável
canônica;
Correlações canônicas: delimitadas por 0 e 1, são mais elevadas
quando a correlação entre Y1 e Y2 é alta. No entanto, não
revelam em que medida as variáveis canônicas estão
relacionadas com Y1 e Y2. As correlações canônicas quadráticas
são iguais aos auto-valores e, de fato, correspondem à
percentagem de variabilidade estimado pela variável canônica. Os
resultados indicados são calculados separadamente para cada
um dos dois grupos de variáveis de entrada;
Coeficientes de redundância: permitem medir para cada conjunto
de variáveis de entrada, a proporção da variabilidade das
variáveis de entrada pelas variáveis canônicas;
Coeficientes canônicos (também chamados de pesos canônicos,
ou coeficientes de função canônica): indicam como as variáveis
canônicas foram construídas, uma vez que correspondem aos
coeficientes da combinação linear que geraram as variáveis
canônicas a partir das variáveis de entrada. Eles são
padronizados, se as variáveis de entrada forem normalizadas.
Neste caso, os pesos relativos de variáveis de entrada podem ser
comparados. Correlações entre as variáveis de entrada e
variáveis canônicas (são coeficientes de estrutura também
chamados de correlação, ou carga fatorial canônica) permitem
entender como as variáveis canônicas estão relacionadas com as
119
variáveis de entrada. Os coeficientes de adequação de variáveis
canônicas correspondem, para uma dada variável canônica, à
soma dos quadrados das correlações entre as variáveis de
entrada e as variáveis canônicas, dividido pelo número de
variáveis de entrada. É dada a percentagem de variabilidade tida
a partir da variável canônica de interesse.
Cossenos quadráticos: cossenos ao quadrado das variáveis de
entrada no espaço de variáveis canônicas, que permitem saber se
uma variável de entrada é bem representada no espaço das
variáveis canônicas. Os cossenos ao quadrado para uma dada
variável de entrada somam o valor 1. A soma de um número
reduzido de eixos canônicos gera a comunalidade;
Escores: correspondem às coordenadas das observações no
espaço das variáveis canônicas.
Bibliografia:
HOTELLING, H. Relations between two sets of variables. Biometrika, 1936, vol.28,
p.321-327.
JOBSON, J.D. Applied Multivariate Data Analysis. Categorical and Multivariate
Methods. Springer-Verlag, New York, 2nd ed, 1992.
LEGENDRE, P.; LEGENDRE, L. Numerical Ecology. Second English Edition. Elsevier,
Amsterdam, 1998.
TUCKER, L.R. An inter-battery method of factor analysis. Psychometrika, 1958, vol.23,
n.2, p.111-136.
5. ANÁLISE DE REGRESSÃO LINEAR
Regressão linear é o método mais utilizado nas análises estatísticas.
Uma distinção é feita geralmente entre a regressão simples (com apenas uma
120
variável explicativa, ou “variável de saída”) e de regressão múltipla (várias
variáveis explicativas), embora o conceito global e métodos de cálculo sejam
idênticos.
Em relação aos resultados, é possível observar:
Resumo de parâmetros estatísticos: as tabelas de estatísticas
descritivas mostram as estatísticas simples para todas as
variáveis selecionadas.apresenta, para os descritores dos
objetos, o número de observações, Resumo das estatísticas: O
número de observações, o número de valores faltantes, o número
de valores não faltantes, a média e o desvio-padrão são exibidos
para as variáveis dependentes (em azul) e as variáveis
quantitativas explicativas. Para variáveis qualitativas explicativas,
os nomes das diversas categorias são exibidos junto com suas
respectivas frequências;
Matriz de correlação: esta tabela é exibida para oferecer uma
visão das correlações entre as diversas variáveis selecionadas;
Resumo da seleção de variáveis: quando um método de seleção
foi escolhido, exibe o resumo de seleção. Para uma seleção
gradual, as estatísticas correspondentes são exibidas para as
diferentes etapas. O melhor modelo para uma série de números
ou variáveis selecionadas será exibido com as estatísticas
correspondente.
Bibliografia:
AKAIKE, H. Information Theory and the Extension of the Maximum Likelihood
Principle. In: Second International Symposium on Information Theory. (Eds: V.N.
Petrov and F. Csaki). Academiai Kiadó, Budapest, 1973, p. 267-281.
121
AMEMIYA, T. Selection of regressors. International Economic Review, 1980, vol.21,
p.331-354.
DEMPSTER, A.P. Elements of Continuous Multivariate Analysis. Addison-Wesley,
Reading, 1969.
JOBSON, J.D. Applied Multivariate Data Analysis: Regression and Experimental
Design. Springer Verlag, New York, 1999, vol1.
MALLOWS, C.L. Some comments on Cp. Technometrics, 1973, vol.15, p.661-675.
TOMASSONE, R.; AUDRAIN, S.; LESQUOY, E.T.; MILLER, C. La Régression,
Nouveaux Regards sur une Ancienne Méthode Statistique. INRA et MASSON, Paris,
1992.
6. ANCOVA
Método que permite modelar uma variável dependente quantitativa
utilizando variáveis quantitativas e qualitativas dependentes, como parte de um
modelo linear.
A ANCOVA (análise de covariância) pode ser vista como uma mistura de
regressão linear e ANOVA como variável dependente e do mesmo tipo. O
modelo é linear e as hipóteses são idênticas.
Na realidade, é mais correto considerar ANOVA e regressão linear como
casos especiais de ANCOVA.
Se p é o número de variáveis quantitativas, e q o número de fatores (as
variáveis qualitativas, incluindo as interações entre as variáveis qualitativas), o
modelo ANCOVA é escrito da seguinte forma:
(1) assumindo-se yi como valor observado para a variável dependente,
para observação i, xij é o valor tomado como j variável quantitativa para a
observação i, k(i, j) é o índice da categoria de j fator de observação i, e i é a
erro do modelo.
122
As hipóteses utilizadas em ANOVA são idênticas às utilizadas na
regressão linear e ANOVA (os erros também são independentes).
Uma das características da análise ANCOVA é permitir interações entre
variáveis quantitativas e os fatores a serem levados em conta. A principal
aplicação é testar se o nível de um fator (uma variável qualitativa) tem uma
influência sobre o coeficiente (muitas vezes chamado “declive” neste contexto)
de uma variável quantitativa. São usados testes de comparação para estimar
se os “declives” que correspondem aos diversos níveis de um fator diferem
significativamente ou não.
Alguns dos possíveis resultados:
Resumo de parâmetros estatísticos: apresenta estatísticas
simples para todas as variáveis selecionadas. O número de
observações, o número de valores faltantes, o número de valores
não faltantes, a média e o desvio padrão são exibidos para as
variáveis dependentes e as variáveis quantitativas explicativas.
Para as variáveis qualitativas explicativas os nomes das diversas
categorias são exibidos junto com suas respectivas frequências.
Matriz de correlação: exibida para oferecer uma visão das
correlações entre as diversas variáveis selecionadas;
Resumo da seleção de variáveis: quando um método de seleção
foi escolhido, o software exibe o resumo de seleção. Para uma
seleção gradual, as estatísticas correspondentes são exibidas
para as diferentes etapas. O melhor modelo para uma série de
123
números ou variáveis selecionadas será exibido com as
estatísticas correspondentes.
Bibliografia:
AKAIKE, H. Information Theory and the Extension of the Maximum Likelihood
Principle. In: Second International Symposium on Information Theory. (Eds: V.N.
Petrov and F. Csaki). Academiai Kiadó, Budapest, 1973, p.267-281.
AMEMIYA, T. Selection of regressors. International Economic Review, 1980, vol.21,
p.331-354.
DEMPSTER, A.P. Elements of Continuous Multivariate Analysis. Addison-Wesley,
Reading, 1969.
HSU, J.C. Multiple Comparisons: Theory and Methods, CRC Press, Boca Raton, 1996.
JOBSON, J.D. Applied Multivariate Data Analysis: Regression and Experimental
Design. Springer Verlag, New York, vol.1, 1999.
LEA, P.; NAES, T.; ROBOTTEN, M. Analysis of Variance for Sensory Data, John
Wiley & Sons, London, 1997.
MALLOWS, C.L. Some comments on Cp. Technometrics, 1973, vol.15, p.661-675.
SAHAI, H.; AGEEL, M.I. The Analysis of Variance. Birkhaüser, Boston, 2000.
TOMASSONE, R.; AUDRAIN, S.; LESQUOY, E.T.; MILLER, C. La Régression,
Nouveaux Regards sur une Ancienne Méthode Statistique. Inra et Masson, Paris,
1992.
7. ANÁLISE DISCRIMINANTE
A análise discriminante é um método antigo (Fisher, 1936), que mudou
pouco nas útimas décadas em sua forma clássica e que é, ao mesmo tempo
um método explicativo e preditivo. Pode ser usado para:
Verificar em um gráfico de duas ou três dimensões, se os grupos aos
quais pertencem as observações são distintos;
Ver as propriedades dos grupos utilizando variáveis explicativas;
Prever se um grupo de observação pode ser utilizado em numerosas
aplicações (exemplo: análise de créditos ou ecologia).
124
Os resultados do modelo como relação de previsão pode ser muito
otimista, pois está efetivamente tentando-se verificar se uma observação é
bem classificada, enquanto a observação em si está sendo usada nos
próprios cálculos do modelo. Por esta razão, a validação cruzada foi
desenvolvida para determinar a probabilidade de uma observação pertencer
aos vários grupos, sendo que neste caso, é removida da amostra de
aprendizagem e em seguida, o modelo e as previsões são calculados. Esta
operação é repetida para todas as observações na amostra de
aprendizagem. Os resultados assim obtidos serão mais representativos da
qualidade do modelo.
O software oferece a opção de cálculo das várias estatísticas associadas
a cada uma das observações em validação cruzada, juntamente com a
tabela de classificação e a curva ROC, caso existam apenas duas classes.
Guia de saídas:
Estatística descritiva: exibe estatísticas descritivas para as
variáveis selecionadas;
Correlações: exibe a matriz de correlação;
Estatísticas de multicolinearidade: exibe a tabela de estatísticas
de multicolinearidade;
Covariâncias: exibe matrizes inter-classe, intra-classe, total intra-
classe, e matrizes de covariância total;
Matrizes SSCP: exibe matrizes inter-classe, total intra-classe, e
SSCP total (soma dos quadrados e produtos da Cruz);
Matrizes de distância: exibe as matrizes de distâncias entre os
grupos;
125
Correlações canônicas e funções: exibe as correlações canônicas
e funções;
Funções de classificação: exibe as funções de classificação;
Autovalores: exibe a tabela e gráfico (scree plot) dos auto-valores;
Autovetores: exibe a tabela autovetor;
Fatores de correlação de variáveis: exibe correlações entre os
fatores e as variáveis;
Escores fatoriais: exibe as coordenadas das observações no
espaço de fatores. As classes anteriores e posteriores para cada
observação, as probabilidades de atribuição para cada classe e
as distâncias das observações de sua centróide também são
apresentados nesta tabela;
Matriz de confusão: exibe a tabela que mostra os coeficientes que
exprimem se as observações são bem ou mal classificadas, para
cada uma das classes;
Matriz de validação cruzada: exibe os resultados de validação
cruzada (probabilidades para observações e matriz de confusão).
Bibliografia:
FISHER, R.A. The use of multiple measurements in taxonomic problems. Annals of
Eugenics, 1936, vol.7, p.179 -188.
HUBERTY, C.J. Applied Discriminant Analysis. Wiley-Interscience, New York, 1994.
JOBSON, J.D. Applied Multivariate Data Analysis: Categorical and Multivariate
Methods. Springer-Verlag, New York, 1992, vol. 2.
LACHENBRUCH, P.A. Discriminant Analysis. Hafner, New York, 1975.
TOMASSONE, R.; DANZART, M.; DAUDIN, J.J.; MASSON, J.P. Discrimination et
Classement. Masson, Paris, 1988.
126
8. ANOVA
Opção de análise a ser utilizada para realizar ANOVA (análise de
variância) de um ou mais fatores balanceados ou não. As opções avançadas
permitem que se escolham as restrições sobre o modelo e as interações entre
os fatores. Pode-se calcular testes de comparação múltipla.
Análise de variância (ANOVA) usa a mesma estrutura conceitual da
regressão linear. A principal diferença está na natureza das variáveis
explanatórias: em lugar de quantitativas, aqui são de base qualitativa. Na
análise ANOVA, as variáveis explicativas são freqüentemente chamados de
fatores. As hipóteses utilizadas em ANOVA são idênticas às utilizadas na
regressão linear.
Alguns dos possíveis resultados:
Resumo da estatística: exibe as estatísticas simples para todas as
variáveis selecionadas. O número de observações, valores
perdidos, o número de não ausentes valores, a média e o desvio
padrão são exibidos para as variáveis dependentes e as variáveis
quantitativas explicativas. Para variáveis qualitativas explicativas,
os nomes das diversas categorias são exibidos junto com suas
respectivas frequências;
Matriz de correlação: exibe as correlações entre as diversas
variáveis selecionadas;
Resumo da seleção de variáveis: quando um método de seleção
for escolhido, é exibido o resumo de seleção. Para uma seleção
gradual, são exibidas as estatísticas correspondentes para as
127
diferentes etapas. Onde o melhor modelo para uma série de
variáveis, que varia de p para q, tenha sido selecionado, o melhor
modelo para cada número ou variáveis é exibido com as
estatísticas correspondentes.
Bibliografia:
AKAIKE, H. Information Theory and the Extension of the Maximum Likelihood
Principle. I Second International Symposium on Information Theory. (Eds: V.N. Petrov
and F. Csaki). Academiai Kiadó, Budapest, 1973, p.267-281.
AMEMIYA, T. Selection of regressors. International Economic Review, 1980, vol.21,
p.331-354.
DEMPSTER, A.P. Elements of Continuous Multivariate Analysis. Addison-Wesley,
1969
HSU, J.C. Multiple Comparisons: Theory and Methods, CRC Press, Boca Raton, 1996.
JOBSON, J.D. Applied Multivariate Data Analysis: Regression and Experimental
Design. Springer Verlag, New York, 1999, vol.1.
LEA, P.; NAES, T.; ROBOTTEN, M. Analysis of Variance for Sensory Data, John Wiley
& Sons, London, 1997.
MALLOWS, C.L. Some comments on Cp. Technometrics, 1973, vol.15, p.661-675.
SAHAI, H.; AGEEL, M.I. The Analysis of Variance. Birkhaüser, Boston, 2000.
TOMASSONE, R.; AUDRAIN, S.; LESQUOY, E.T.; MILLER, C. La Régression,
Nouveaux Regards sur une Ancienne Méthode Statistique. Inra et Masson, Paris,
1992.
128
Anexo 7
Medidas acústicas- descrição das medidas extraídas pelo script
ExpressionEvaluator (BARBOSA, 2009) aplicável ao software de livre
acesso PRAAT
- Prontidão: medida fundamentada na variação de f0 e de ênfase
espectral, sendo diretamente proporcional à quantidade de declínios de f0 e
inversamente proporcional à média da ênfase espectral.
- Mediana de f0 (frequência fundamental): medida que pode ser
considerada como a f0 habitual do falante. Sua extração prevê a
suavização de valores. Trata -se de uma medida que evita erros de
detecção do valor de f0 que podem ser frequentes, sobretudo os que
mudam o valor para uma oitava abaixo ou acima;
- Semi-amplitude entre quartis de f0: medida de variação dos valores
de f0, excluindo-se valores espúrios (por motivos de normalização, foi
dividida pela metade, justificando a atribuição do termo “semi-amplitude”). O
termo amplitude refere-se à variação da medida;
- Quantil 99,5% de f0: valores de frequência fundamental normalizados
por meio do cálculo de Z-Score da mediana (dobro), acrescido do valor de
desvio padrão. Esta medida busca, sem valores espúrios, detectar o limite
superior de f0 do falante;
- Média de primeira derivada de f0: representa a taxa de variação de
uma função. Medida que considera não somente a variação, mas a
“velocidade” dessa alteração/variação;
129
- Assimetria de f0: medida da assimetria de distribuição de f0, baseada
na razão entre diferença entre média e mediana/semi-amplitude entre quartis
de f0. Esta medida busca estimar a tendência em ter valores à esquerda
(negativos) ou à direita da média (positivos);
- Desvio padrão de primeira derivada de f0: medida que infere a
dispersão estatística conforme a variância de f0 contida na amostra;
- Assimetria de primeira derivada de f0: infere relações de como
aconteceram as mudanças de taxa de variação de f0 na função;
- Assimetria de intensidade: medida de intensidade normalizada,
baseada na proporção de intensidade no intervalo de frequências de 0,0-1250
Hz/1250-4000 Hz. Permite que as amostras possam ter suas intensidades
estimadas, mesmo aquelas que não tenham sido captadas com fixação da
distância entre boca e microfone;
- Média de declínio espectral: média de valores da proporção de
intensidade nos intervalos de 0-1,0 kHz/1,0-4,0 kHz. Considerada como
importante medida do nível de tensão laríngea do estímulo aferido;
- Desvio padrão de declínio espectral: medida do desvio padrão de
declínio espectral (acima explanada);
- Assimetria de declínio espectral: medida de assimetria de
distribuição das medidas de declínio espectral (acima explanada);
- Desvio-padrão de espectro de longo termo (LTAS): desvio padrão
das medidas normalizadas de intensidade ao longo de intervalos de
frequências do espectro sonoro.
131
Anexo 9
Medida da distância entre o dente segundo pré-molar superior e o
mento (queixo) extraídas por meio do software Osiris relacionado ao
experimento 1.
Figura 43: Medida da distância entre o dente
segundo pré-molar superior e o mento (queixo)
na situação de repouso
Emissão de [a] (sApo) – voz cantada
sem instrução baseada em metáfora
Emissão de [u] (jurUru) – voz cantada
sem instrução baseada em metáfora
Emissão de [i] (rIo) – voz cantada sem Emissão de [i] (frIo) – voz cantada sem
132
instrução baseada em metáfora instrução baseada em metáfora
Emissão de [Ɛ] (é que) – voz cantada
sem instrução baseada em metáfora
Figura 44. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da
distância entre o dente segundo pré-molar superior e o mento extraídas das emissões
em voz cantada produzidas sem intruções baseadas em metáforas
Emissão de [a] (sApo) – voz
cantada produzida por meio de
instrução baseada na metáfora
prisma
Emissão de [u] (jurUru) – voz cantada
produzida por meio de instrução
baseada na metáfora prisma
133
Emissão de [i] (rIo) – voz cantada
produzida por meio de instrução
baseada na metáfora prisma
Emissão de [i] (frIo) – voz cantada
produzida por meio de instrução
baseada na metáfora prisma
Emissão de [Ɛ] (é que) – voz
cantada produzida por meio de
instrução baseada na metáfora
prisma
Figura 45. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da
distância entre o dente segundo pré-molar superior e o mento extraídas das emissões
em voz cantada produzidas por meio de instruções baseadas na metáfora prisma.
134
Emissão de [a] (sApo) – voz
cantada produzida por meio de
instrução baseada na metáfora
catedral
Emissão de [u] (jurUru) – voz
cantada produzida por meio de
instrução baseada na metáfora
catedral
Emissão de [i] (rIo) – voz cantada
produzida por meio de instrução
baseada na metáfora catedral
Emissão de [i] (frIo) – voz cantada
produzida por meio de instrução
baseada na metáfora catedral
Emissão de [Ɛ] (é que) – voz
cantada produzida por meio de
instrução baseada na metáfora
catedral
135
Figura 46. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da
distância entre o dente segundo pré-molar superior e o mento extraídas das emissões
em voz cantada produzidas por meio de instruções baseadas na metáfora catedral.
Emissão de [a] (sApo) – voz cantada
produzida por meio de instrução
baseada na metáfora disco voador
Emissão de [u] (jurUru) – voz cantada
produzida por meio de instrução
baseada na metáfora disco voador
Emissão de [i] (rIo) – voz cantada
produzida por meio de instrução
baseada na metáfora disco voador
Emissão de [i] (frIo) – voz cantada
produzida por meio de instrução
baseada na metáfora disco voador
Emissão de [Ɛ] (é que) – voz cantada
produzida por meio de instrução
baseada na metáfora disco voador
136
Figura 47. Dados de imagens de trato vocal ilustrativos das medidas (em mm) da
distância entre o dente segundo pré-molar superior e o mento extraídas das emissões
em voz cantada produzidas por meio de instruções baseadas na metáfora disco
voador.
137
9. REFERÊNCIAS BIBLIOGRÁFICAS
AGUIAR, M.C.P. O Ensino de Canto em Portugal: uma perspectiva analítico-
reflexiva a partir de meados do Século XX. Dissertação (Mestrado em
Comunicação e Arte). Universidade de Aveiro, Portugal, 2007.
ALVES, C.C.; CAMARGO, Z. Índices acústicos e perceptivo-auditivos da voz
disfônica: correlações entre mecanismos vibratórios e articulatórios. Iniciação
Científica (Departamento de Lingüística). Pontifícia Universidade Católica de
São Paulo, Cnpq, São Paulo, 2006.
ANDRADA e SILVA, M. A.; DUPRAT, A. C. Voz Cantada. In: FERREIRA, L. P.;
BEFI-LOPES, D.M.; LIMONGI, S.C. Tratado de Fonoaudiologia, ed. Roca, 1ed,
São Paulo, 2004.
ARAÚJO, S.A.; GRELLET, M.; PEREIRA, J.C. Normatização de medidas
acústicas da voz normal. Revista Brasileira de Otorrinolaringologia, 2002, v.68,
n.4, p.-540-544.
AULETE, C. Dicionário Aulete Digital. Lexicon editora digital, 2007.
BARBOSA, P.A. Detecting changes in speech expressiveness in participants of
a radio program In: Proc. of Interspeech, Brighton, Reino Unido, 2009, v.1,
p.2155-2158.
BEZERRA, A.A.; CUKIER-BLAJ, S.; DUPRAT, A.; CAMARGO, Z.; GRANATO,
L. The characterization of the vibrato in lyric and sertanejo singing styles:
acoustic and perceptual auditory aspects. Journal of Voice, 2008, v.26. n.6.
p.666-670.
BILTON, T.L; LEDERNMAN, H.M. Videodeglutuesofagograma: principais
aspectos por imagem. Revista Imagem, 1998, v.20, n. 1, p. 27-28.
BOIX, J.L. Introduccion a la fonetica: el metodo experimental. Ed Anthropos,
1991.
CAMARGO, Z.; MADUREIRA, S. Análise Acústica: revisão crítica de estudos
no campo das disfonias. In: FERREIRA, L. P.; BEFI-LOPES, D.M.; LIMONGI,
S.C. Tratado de Fonoaudiologia, ed Roca, 1ed, São Paulo, 2004, p.25-33.
CAMARGO, Z.; MADUREIRA, S.; CROCHIQUIA, A. Voice qualities and
metaphorical analogies: the soundmetaphors. Conference: Metaphor in Mind
and Society. Book of Abstracts.Cambridge Scholar Publishing, Lancaster
University, UK, 2012, p.109.
CANHETTI, C.; MENEGON, P. Effects of voice quality based on metaphors.
138
Second Cebtral European Conference in Linguistics for postgraduate students-
CECILS 2, Pázmany Peter Catholic University, Budapeste, 2012.
CARLSSON, G.; SUNDBERG, J. Formant frequency tuning in singing. Journal
of Voice, 1992, v.6, n.3, p.256-260.
CLEMENTS, J.F. The use of imagery in teaching voice to the twenty-first
century student. Dissertation, Florida State University College of Music, 2008.
CORDEIRO, G.F.; PINHO, S.; CAMARGO, Z.A. Formante do cantor – um
enfoque fisiológico. In: PINHO, S. Temas em voz profissional, ed Revinter, São
Paulo, 2007, p.23-30.
COSTA, M.M.B.; CANEVARO, L.V.; AZEVEDO, A.C.P.; MARINHA, M.D.S.
Valores típicos do “produto dose-área” (DAP) obtido durante o estudo
videofluoroscópico da deglutição. Revista Radiologia Brasileira, 2003, v.36, n.1,
p.17-20.
DI CARLO, N.S. L’intelligibilité de la voix chantée. Medicine des Art 10, 1994,
pp. 2-15.
DUPRAT, A.; COSTA, H. O.; ECKLEY, C.; ANDRADA E SILVA, M.A.
Caracterização do profissional da voz para o laringologista. Revista Brasileira
de Otorrinolaringologia, 2000, v.66, n.2, p.129-134.
DRAHAN, S.H.; RICZ, M.A.; MONARETTI, T.K.T.; RICZ, L.N.A. Dimensão do
trato vocal de cantoras profissionais e não profissionais durante o repouso e o
canto. Arquivos internacionais de otorrinolaringologia, 11º Congresso da
Fundação Otorrinolaringologia, 2012, v.16, n.1.
ECHTERNACH, M.; SUNDBERG, J.; ARNDT, S.; MARKL, M.; SCHUMACHER,
M.; RICHTER, B. Vocal Tract in Female Registers- A Dynamic Real-Time MRI
Study. Journal of Voice, 2008, v.24, n.2,p.133-139.
EISENSTEIN, E. Adolescência: definições, conceitos e critérios. Adolesc.
Saude, 2005, v.2, n.2, p.6-7.
ERICSDOTTER, C.; SUNDBERG, J.; LINDBLOM, B.; STARK, J. The apex
model - From articulatory position to sound. Acoustical Society of America,
1998, v.104, n.3, p.1820-1820.
FANT, G. Acoustic theory of speech production. Mouton The Hague, 1960.
FELIPPE, A.C.N.; GRILLO, N.H.M.M.; GRENCHI, T.H. Normatização das
medidas acústicas para vozes normais. Revista Brasileira de
Otorrinolaringologia, 2006, v.72, n.5, p.659-664.
139
FIRMAN, C.M.G.; COSTA, M.M.B.; COSTA, M.L.; LEMME, E. Avaliação
quantitativa e qualitativa dos esvaziamento gástrico através do método
videofluoroscópico. Rev Arquivos de Gastroenterologia, São Paulo, 2000, v.37,
n.2.
FONAGY, I. La mimique buccale. Phonetica, 1976, v.33, n,1, p.31-44.
FONAGY, I. La Vive Voix. ed Payot, Paris 1983.
FONAGY, I. Languages within languages: an evolutive approach. John
Benjamins Publishing Company, Amsterdam, 2000.
FUKS, L. Um apito no samba: aspectos acústicos e perceptivos. São Paulo,
1999.
GONÇALVES, C.G.A.B. Análise perceptivo-auditiva da fala e avaliação
videofluoroscópica da posição da língua em fissurados de palato. Dissertação
(Mestrado em Distúrbios da Comunicação Humana). Universidade de São
Paulo- USP, São Paulo, 2002.
GUSMÃO, C.S.; CAMPOS, P.H.; MAIA, M.E.O. O formante do cantor e os
ajustes laríngeos utilizados para realizá-los: uma revisão descritiva. Revista
Acadêmica de Música, 2010, n.21, p.43-50.
GUSSENHOVEN, C. The Phonology of Tone and Intonation. Cambridge
University Press, Cambridge, 2004.
GREGIO, F.N. Configuração do trato vocal supraglótico na produção das
vogais do português brasileiro: dados de imagem de ressonância magnética.
Dissertação (Mestrado em Lingüística Aplicada). Pontifícia Universidade
Católica de São Paulo, São Paulo, 2006.
HANAYAMA, E.M. Voz metálica: estudo das características fisiológicas e
acústicas. Dissertação (Mestrado em Fisiopatologia Experimental),
Universidade de São Paulo-USP, São Paulo, 2003.
HANAYAMA, E.M.; CAMARGO, Z.; TSUJI, D.H.; PINHO, S.M.R. Metallic Voice:
Physiological and Acoustic Features. Journal of Voice, 2009, v.23, p.62-70.
HENRICH, N.; BEZARD, P.; EXPERT, R.; GARNIER, M.; GUERIN, C.;
PILLOT, C.; QUATTROCCHI, S.; ROUBEAU, B.; TERK, B. Perception and
verbalisation of voice quality in western lyrical singing: Contribution of a
multidisciplinary research group. Hyper Articles on Ligne, 3rd Conference on
Interdisciplinary Musicology, Estonie, 2007.
140
HINTON, L.; NICHOLS, J.; OHALA, J. J. Sound Symbolism. Cambridge
University Press, Cambridge, 1994.
HIRANO, M. Vocal mechanisms in singing. Laryngological and phoniatric
aspects. Journal of Voice, 1988, v.2, n.1, p.51-69.
IWARSSON, J.; SUNDBERG, J. Effects of lung volume on vertical larynx
position during phonation. Journal of Voice, 1998, v.12, n.2, p.159-165.
IWARSSON, J. Effects of Inhalatory Abdominal Wall Movement on Vertical
Laryngeal Position During Phonation. Journal of Voice, 2001, v.15, n.3, p.384-
394.
JOHNSTONE, T.; BANSE, R.; SCHERER, K.R. Acoustic profiles in prototypical
vocal expressions of emotion, ICPhS, 1995, v.4, n.2, p.2-5.
JOHNSTONE, T.; SCHERER, K.R. The effects of emotions on voice quality.
XIVth International Congress of Phonetic, Citeseer, 1999.
JOTZ, G.P.; CERVANTES, O.; SETTANI, F.A.P.; ANGELIS, E.C. Acoustic
measures for the detection of hoarseness in children. Arquivos Internacionais
Otorrinolaringologista, 2006, v.10, n.1, p.14-20.
KENT, R. D.; READ, C. The acoustic analysis of speech. Singular Publishing
Group, Califórnia, 1992.
KENT, R.D. Speech Sciences. Ed Revinter, Rio de Janeiro, 1993.
LAVER, J. The phonetic description of voice quality. Cambridge textbook in
linguistics, Cambridge University Press, Cambridge, 1980.
LAVER, J.; WIRS, S.; MACKENZIE, J.; HILLER, S.M. A perceptual protocol for
the analysis of vocal profiles. Edinburg University Department of Linguistics
Work in Progress, 1981, v.14, p.139-155.
LAVER, J.; HILLER, S.; HANSON, R. Comparative performance of pitch
detection algorithms on dysphonic voices. In: International Conference on
Acoustics, Speech and Signal Processing, Paris, 1982, v.5.
LAVER, J. Principles of Phonetics. Cambridge textbook in linguistics,
Cambridge University Press, 1994.
LAVER, J. Phonetic evaluation of voice quality. In: KENT, R.D.; BALL, M.J.
Voice quality measurement, Singular Publishing Group, San Diego, 2000, p.37-
48.
141
LEVY, D.S.; CRISTOVÃO, P.W.; GABBI, S. Protocolo do Estudo Dinâmico da
Deglutição por Videofluoroscopia. In: Disfagia: Avaliação e Tratamento, Rio de
Janeiro, ed Revinter, 2004, p.134-140.
LIEBERMAN, P.; BLUMSTEIN, S.E. Speech physiology, speech perception and
acoustic phonetics. Cambridge Studies in Speech Science and
Communication, Cambridge University Press, 1988.
LINDBLOM, B.E.F.; SUNDBERG, J. Acoustical Consequences of Lip, Tongue,
Jaw and Larynx Movement. Journal of Acoust. Soc. Am., 1971, v.50, n.4, p.
1166-1179.
LOPASSO, C. A videofluoroscopia e quantificação virtual do esvaziamento
gástrico. Revista Arquivos de Gastroenterologia, 2000, v.37, n.2.
MACHADO, M.M. Fenômeno de nasalização vocálica em português: estudo
cine-radiográfico. Cad. Est. Ling., 1993, v.25, p.113-128.
MACKENZIE-BECK, J. Perceptual analysis of voice quality: the place of vocal
profile analysis. In: HARDCASTLE, W.J.; MACKENZIE-BECK, J. A figure of
speech: a festschrift for John, 2005.
MADUREIRA, S. Sobre a expressividade da fala. In: KYRILLOS, L.
Expressividade: da teoria à prática. Ed. Revinter, Rio de Janeiro, 2005.
MANGILLI, L.D.; AMOROSO, M.R.M.; NISHIMOTO, I.N.; BARROS, A.P.B.;
CARRARA-DE-ANGELIS, E. Voz, deglutição e qualidade de vida de pacientes
com alteração de mobilidade de prega vocal unilateral pré e pós-fonoterapia.
Revista Sociedade Brasileira de Fonoaudiologia, 2008, v.13, n.2, p.103-112.
MASTER, S.; PONTES, P.; PAULO, A.L.; BEHLAU, M. Configuraçöes do trato
vocal nas vogais nasais do português brasileiro. Acta Awho, 1991, v.10, n.2,
p.67-70.
MASTER, S.; BIASE, N.; PEDROSA, V.; CHIARI, B.M. O espectro médio de
longo termo na pesquisa e na clínica fonoaudiológica. Revista Pró-Fono, 2006,
v.18, n.1, p.111-120.
MEDEIROS, B.R. Descrição comparativa de aspectos fonético-acústicos
selecionados da fala e do canto em português brasileiro. Tese (Doutorado em
Linguística), Universidade Estadual de Campinas- UNICAMP, Campinas, 2002.
MENDES, B.C.A. Estudo fonético-acústico das vogais do português brasileiro:
dados da produção e percepção da fala de um sujeito deficiente auditivo. Tese
(Doutorado em lingüística aplicada e estudos da Linguagem), Pontifícia
Universidade Católica de São Paulo, São Paulo, 2003.
142
MILLER, D.G.; SCHUTTE, H.K. Formant tuning in a professional baritone.
1990, v.4, n.3, p.231-237.
MOSCA, L.G.; MOSCA, L.E. Tecnica radiologica: teoria y practica. Ed López
Libreros, Buenos Aires, 1971, p.141–145.
MOTA, L.A.A.; SANTOS, C.M.B.; BARBOSA, K.M.F.; NETO, J.R.N. Disfonia
em cantores: revisão de literatura. Revista Acta Otorrinolaringologia, 2010,
v.28, n.1, p.27-31.
MCALLISTER, A.; SEDERHOLM, E.; SUNDBERG, J. Perceptual and acoustic
analysis of vocal registers in 10-year-old children. Logoped Phoniatr Vocol,
2000, v.25, n.2, p.63-71.
NORDENBERG, M.; SUNDBERG, J. Effect on LTAS of vocal loudness
variation. Logopedics Phoniatrics Vocology, 2004, v.29, n.4, p.183-191.
NUÑES, K.L. Configuração do trato vocal na fonação habitual e no canto
popular. Dissertação (Mestrado em Fonoaudiologia). Universidade Tuiuti do
Paraná, Curitiba, 2006.
OHALA, J.J. Sound Symbolism. Proceedings of the 4th Seoul International,
University of California, 1997.
OLIVEIRA, L.R. Análise acústica comparativa das vogais orais
entrerespiradores orais e nasais. Dissertação (Mestrado em Linguística
Aplicada e Estudos da Linguagem), Pontifícia Universidade Católica de São
Paulo, São Paulo, 2011.
PASSAROTTI, G.H.; CANIELLO, M.; HACHIYA, A.; SANTORO, P.P.;
IMAMURA, R.; TSUJI, D.H. Amiloidose com múltiplos focos em trato aéreo-
digestivo superior: relato de caso e revisão de literatura. Revista Brasileira de
Otorrinolaringologia, 2008, v.74, n.3, p.462-466.
PEDROSO, M.I.L. Técnicas vocais para os profissionais da voz. Monografia
(Especialização em Voz), CEFAC, São Paulo, 1997.
PEREIRA, C. Dimensions of emotional meaning in speech. SpeechEmotion,
2000, p.25-28.
PEREIRA, A.L.S. As cores da voz – expressão das emoções no timbre da voz
cantada. Revista Cadernos de Saúde. Instituto de Ciências da Saúde
Universidade Católica Portuguesa, 2008, v.1. n.2.
PESSOA, A. N.; NOVAES, B.C.A.C.; PEREIRA, L.K.; CAMARGO, Z.A. Dados
de dinâmica e qualidade vocal: correlatos acústicos e perceptivo-auditivos da
143
fala em crianças usuárias de implante coclear. Journal of Speech Sciences,
2011, v.1, n.2, p.17-33.
PINHO, S.M.R. Avaliação e tratamento da voz. In: PINHO, S.M.R.
Fundamentos em fonoaudiologia: tratando os distúrbios da voz, ed Guanabara
Koogan, Rio de Janeiro, 1998.
PINHO, S.; PONTES, P. Desvendando os segredos da voz: músculos
intrínsecos da laringe e dinâmica vocal. Ed Revinter, v.1, Rio de Janeiro, 2008.
REHDER, M.I.B.C.; BEHLAU, M.S. Perfil vocal de regentes de coral do estado
de São Paulo. Revista CEFAC, 2008, v.10, n.2, p.206-217.
ROERS, F.; MÜRBE, D.; SUNDBERG, J. Predicted singers vocal fold lengths
and voice classification - a study of x-ray morphological measures. Journal of
Voice, 2009, v.23, n.4, p.408-13.
ROSSBACH, R.F. Aplicando metáforas físicas no repertório coral. Revista de
Letras, Artes e Comunicação, 2011, v.5, n.2, p.153-166.
SALOMÃO, G.L. Registros vocais no canto: aspectos perceptivos, acústicos,
aerodinâmicos e fisiológicos da voz modal e da voz de falsete. Tese
(Doutorado em Lingüística Aplicada e Estudos da Linguagem). Pontifícia
Universidade Católica de São Paulo, São Paulo, 2008.
SOUSA, J.M.; ANDRADA E SILVA, M.A.; FERREIRA, L.P. O uso de metáforas
como recurso didático no ensino do canto: diferentes abordagens. Revista
Sociedade Brasileira de Fonoaudiologia, São Paulo, 2010, v.15, n.3, p.317-328.
SOUZA, D.P.D. Estudo da fonação e de respiração, com apoio abdominal
expandido e contraído, em cantores líricos. Dissertação (Mestrado em
Distúrbios da Comunicação), Universidade Tuiti do Paraná, Curtitiba, 2008.
SUNDBERG, J. Formant structure and articulation of spoken and sung vowels.
Folia Phoniat, 1970, v.22, p.28-48.
SUNDBERG, J. Articulatory interpretation of the “singing formant”. Journal
Acoust. Soc. Am, 1974, v.55, n.4, p.838-844.
SUNDBERG, J. Formant technique in a professional female singer. Acustica,
1975, v.32, p.89-96.
SUNDBERG, J. The acoustic of singing voice, 1977, p.104-116.
SUNDBERG, J. Perception of singing. Speech Transmission Laboratory
Quarterly Progress and Status Report 1, Royal Institute of Technology-KTH,
1979, p.1-48.
144
SUNDBERG, J. Speech, sound and emotions. In: CLYNES, M. Music, mind,
and brain- the neuropsychology of music. Plenum Publishing Corporation, New
York, 1982, p.137- 149.
SUNDBERG, J.; ASKENFELT, A. Larynx height and voice source: a
relationship?. Vocal Folds Physiology, College-Hill Press, San Diego, Califórnia,
1983, p.307-316.
SUNDBERG, J. The Science of the Singing Voice. Dekalb, Illinois, 1987.
SUNBERG, J.; JOHANSSON, C.; WILBRAND, H.; YTTERBERGH, C. From
sagittal distance to area. Phonetica, 1987, v.44, p.76-90.
SUNDBERG, J.; LEANDERSON, R.; EULER, C. Activity relationship between
diaphragm and cricothyroid muscles. Journal of Voice, 1989, v.3, n.1, p.225-
232.
SUNDBERG, J. What´s so special about singers? Journal of Voice, 1990, v.4,
n.2, p.107-119.
SUNDBERG, J. Breathing behavior during singing. Journal STL-QPSR, 1992,
v.33, n.1,p.49-64.
SUNDBERG, J. Human singing voice. In: CROCKER, M.J. Encyclopedia of
acoustics, John Wiley & Sons, Nova Jersey, 1997, p.1687-1695.
SUNDBERG, J.; SKOOG, J. Dependence of jaw opening on pitch and vowel in
singers. Journal of Voice, Filadélfia, 1997, v.11, n.3, p.301-306.
SUNDBERG, J. Research on the singing voice in retrospect. Journal TMH-
QPSR, 2003, v.45, n.1, p.11-22.
SUNDBERG, J. Articulatory configuration and pitch in a classically trained
soprano singer. Journal of Voice, 2008, v.23, n.5. p.546-551.
SCHERER, K.R.; BANZIGER, T. Emotional expression in prosody: a review
and an agenda for future research. Departament of psychology, University of
Geneva, Switzerland, 2003.
SVICERO, M.A.F. Caracterização acústica e de imagens de ultrassonografia
das vogais orais do Português Brasileiro. Dissertação (Mestrado em Linguistica
Aplicada e Estudos da Linguagem), Pontifícia Universidade Católica de São
Paulo, 2012.
145
TAVANO, K.C.A. Análise acústica e imagem da emissão de vogais em
cantoras líricas e populares. Dissertação (Mestrado em Distúrbios da
Comunicação), Universidade Tuiti do Paraná, Curitiba, 2011.
TRAVASSOS, E. Um objeto fugidio: voz e “musicologias”. Revista Música em
Perspectiva. 2008, v.1, n.1, p.14-42.
THOMÉ, R.C. A doença de Parkinson: perspectivas sobre o tratamento
fonoterápico. Monografia (Especialização em Fonoaudiologia), CEFAC, Bahia,
1999.
ULLOA, J.M. El gesto instrumental y la voz cantada em la significación musical.
Revista Musical Chilena, 2009, v.63, n.211, p.54-65.
WILIAMS, R.G.; ECCLES, R. A new clinical measure of external laryngeal size
which predicts the fundamental frequency of the larynx. Acta Otolaryngol,
(Stockh), 1990, v.110, p.141-148.
VENTURA, S.M.R.; FREITAS, D.R.S.; RAMOS, I.M.A.P.; TAVARES, J.M.R.S.
Utilização da Imagem por Ressonância Magnética nos Estudos sobre a
Produção da Fala. Revista Científica Nacional, 2010, p.1-15.
VIEIRA, M.N. Uma introdução à acústica da voz cantada. Anais do I Seminário
Música Ciência Tecnologia, São Paulo, 2004.
VILKMAN, E.; SONNINEM, A.; HURME, P.; KORKKO, P. External laryngeal
frame function in voice production revisited: A review. Journal of Voice, 1996,
v.10, n.1, p.78-92.
ZAMPIERI, S.A.; BEHLAU, M.; BRASIL, O.O.C. Análise de cantores de baile
em estilo de canto popular e lírico: perceptivo-auditiva, acústica e da
configuração laríngea. Revista Brasileira de Otorrinolaringologia, 2002, v.68,
n.3, p.378-386.