raportmniejszosci.pl prezentacja z 30 wrzesnia
-
Upload
fundacja-wiedza-lokalna -
Category
Technology
-
view
1.384 -
download
1
description
Transcript of raportmniejszosci.pl prezentacja z 30 wrzesnia
MOWA NIENAWIŚCI I JĘZYK WROGOŚCI W POLSKIM INTERNECIE
.R AP O R TMN IE J S ZO S C I P LJacek BielińskiMarek TroszyńskiAleksander Wawer
. WIED ZALO KALN A P L
NASZYM CELEM JEST PRZEKSZTAŁCANIE WIEDZY O CHARAKTERZE AKADEMICKIM W WIEDZĘ UŻYTECZNĄ DLA DIAGNOZOWANIA POTRZEB I ROZWIĄZYWANIA PROBLEMÓW NA POZIOMIE LOKALNYM
RAPORTMNIEJSZOSCI.PL
czyli „Opracowanie systemu monitorowania polskiego internetu pod kątem występowania mowy nienawiści i języka wrogości wobec mniejszości etnicznych, seksualnych, religijnych i innych”;
finansowany z programu ‘Demokracja w działaniu. Tolerancja’ Fundacji im. Stefana Batorego,
współpraca: Centrum Badań nad Nowymi Mediami Collegium Civitas
początek projektu: lipiec 2010; koniec projektu: czerwiec 2011.
R AP O R TMN IE J S ZO S C.I P L
ZAŁOŻENIA PROJEKTU
ZAŁOŻENIA PROJEKTU RAPORTMNIEJSZOSCI.PL sfera prywatna vs sfera publiczna– media tradycyjne vs internet
perspektywa liberalna vs. konserwatywno-tradycjonalistyczna
mowa nienawiści:– silne (skrajne) negatywne emocje– przedmiot odniesienia wypowiedzi pojmowany jako
przedstawiciel grupy (mniejszości)• „kowalski jest głupi” -> OK• „ten żyd/ gej/ Słowak kowalski jest głupi” -> nieOK
STOSUNEK WOBEC MOWY NIENAWIŚCI W POLSCE
: D a n e z b a d a n ia Wo r ld In t e r n e t P r o je c t, P o la n d lipiec, 2010
STOSUNEK WOBEC MOWY NIENAWIŚCI W POLSCE
: D a n e z b a d a n ia Wo r ld In t e r n e t P r o je c t, P o la n d lipiec, 2010
STOSUNEK WOBEC MOWY NIENAWIŚCI W POLSCE
: D a n e z b a d a n ia Wo r ld In t e r n e t P r o je c t, P o la n d lipiec, 2010
R AP O R TMN IE J S ZO S C.I P L
ZBIERANIE INFORMACJI
2 crawlery:– skan całego polskiego internetu
zaindeksowanego przez bing.com + uniwersalna metoda ekstrakcji treści z HTML,
– przeszukanie forów na głównych portalach i komentarzy pod artykułami;• dedykowane mechanizmy crawlowania rozpoznające
poszczególne posty: treść, autorów (nicki piszących), strukturę wątków, datę
• zastosujemy metodę ekstrakcji treści z HTML dostrojoną do każdego z forów
przeszukiwanie w oparciu o słowa klucze (+ synonimy) – określenia mniejszości
ANALIZA INFORMACJI
rozpoznawanie wypowiedzi możliwe jest dzięki algorytmom przetwarzania języka naturalnego oraz uczenia maszynowego,
proces będzie się składał z następujących etapów:– tokenizacja i podział na zdania,– analiza syntaktyczno-semantyczna zdań,– wyliczanie podobieństwa między wzorcowymi wypowiedziami
mowy nienawiści a rozważaną wypowiedzią, z wykorzystaniem wektorowej reprezentacji znaczeń, osiąganej dzięki poprzednim etapom przetwarzania,
– uczenie maszynowe - klasyfikacja tak reprezentowanej wypowiedzi jako potencjalnej mowy nienawiści
moduł przypisujący wypowiedź do lokalizacji (geograficznej)
CYKL DZIAŁAŃ
PRZYKŁAD
rozpoznanie pozytywnych (zielone) i negatywnych (czerwone) odniesień
REZULTAT
publicznie dostępna (dla ngo/badaczy/prasy) baza danych zawierająca zbiór tekstów z polskiego internetu zakwalifikowanych jako mowa nienawiści;
przyjazny użytkownikowi interfejs umożliwiający selekcję tekstów wg wybranych kryteriów:– mniejszości (przedmiotu wypowiedzi)– poziomu nasycenia mową nienawiści (np. skala
1-10)– lokalizacji (województwo)– daty włączenie do bazy.
WYM IARP R AKTYC ZN Y
PRZEWIDYWANE POLA WYKORZYSTANIA
CELE PROJEKTU
Kategoryzacja dyskursu publicznego w polskim internecie (odnoszącego się do mniejszości)
Zbieranie korpusu tekstów, który może być wykorzystywany przez badaczy z różnych dyscyplin nauk społecznych.
Cele praktyczne: skrajne przykłady mogą stać się podstawą do zawiadomienia
prokuratury ‘miękka presja’ na właścicieli portali, blogów, forów; działanie w realnym wymiarze społecznym – wykorzystanie
odniesienia do lokalności (np. zapobieganie narastającym konfliktom);
jako materiał edukacyjny (słowa nie są niewinne).
OBIEKTYWIZACJA POPRZEZ BADANIE OPINII
jak ocenić natężenie mowy nienawiści/języka wrogości? badanie sondażowe na reprezentatywnej próbie
internautów lub reprezentatywnej próbie dorosłych mieszkańców Polski.
Wskaźniki pozwalające na 'obiektywizację' (lub intersubiektywizację) ocen:– seria kilkudziesięciu stwierdzeń do oceny na skali– odniesienie osobiste (Czy uznałby/aby P. za obrażające P.
następujące wypowiedzi. Jak bardzo poczułby/aby się P. urażony)
– odniesienie do mniejszości (Czy w P. przekonaniu następujące wypowiedzi obrażają daną mniejszość) – przedmiot wypowiedzi to określona mniejszość
WĄTPLIWOŚCI I ZAGROŻENIA
Zejście z piedestału obiektywności nauki?
Zagrożenie ograniczenia wolności słowa Zarzut arbitralności oceny wypowiedzi Zarzut arbitralności wyboru tekstów Zarzut znikomej szkodliwości zjawiska
WĄTPLIWOŚCI I ZAGROŻENIA
‘Wielki Brat patrzy, czyli totalna inwigilacja’;
‘kto dał wam prawo oceny’; ‘też sobie możemy zrobić taką listę’; ‘no tak, jest, i co z tego?’
WSPÓŁPRACA
Kampania przeciw Homofobii; Stowarzyszenie Otwarta Rzeczpospolita; Stowarzyszenie Nigdy Więcej.
D Z IĘKU J EMY ZAUWAG Ę