2. 측정의수준 - KOCWcontents.kocw.net/KOCW/document/2015/hanyang/ahnjong... · 2016-09-09 ·...

22
2. 측정의 수준 측정의 수준(levels of measurement)<- 각 기호가 보유하는 정보의 내용에 따라 구분 가능 다양한 사회현상의 속성을 재는 기본적인 자 근원척도의 유형(types of primary scale) or 종류 1) 명목척도 명목척도(nominal scale) 현상의 속성에 부여된 수(number)가 그 현상의 속성이 어떠한 유형으로 구분되는지만을 알려주는 경우, 이러한 정보만을 가진 자 명목척도의 특징을 가진 자로 잰 수가 제공하는 정보는, 유형(category) 만을 구분, 이렇게 수집된 자료에 적용 가능한 통계분석기법이 제한됨 사칙연산 무의미 예) 성별 제3장 현상의 측정 1 제1절 경영/경제 현상 측정의 의미 출처 : 신민철 저 “경영경제 통계학의 기초, 창민출판사, 2010년, 일부수정

Transcript of 2. 측정의수준 - KOCWcontents.kocw.net/KOCW/document/2015/hanyang/ahnjong... · 2016-09-09 ·...

  • 2. 측정의 수준

    측정의 수준(levels of measurement)

  • 명목척도의 예

    제3장 현상의 측정 2

    제1절 경영/경제현상 측정의의미

    변 수응답자 성 별 소유자동차

    응답자 1

    응답자 2

    :

    :

    응답자 99

    응답자 100

    남 (=1)

    여 (=2)

    :

    :

    남 (=1)

    여 (=2)

    Sonata (=1)

    SM5 (=2)

    :

    :

    SM5 (=2)

    Sonata (=1)

  • 2) 서열척도

    서열척도(ordinal scale)

    사용되는 수가 유형(category)의 구분은 물론 조사현상의 순위정보까지

    알려주고 있는 자

    측정된 수들(numbers)간의 크기 비교는 무의미

    서열척도의 예

    제3장 현상의 측정 3

    제1절 경영/경제현상 측정의의미

    변 수응답자 화장품 A 화장품 B 화장품 C

    응답자 1

    응답자 2

    :

    :

    응답자 99

    응답자 100

    1(위)

    1

    :

    :

    2

    1

    2(위)

    3

    :

    :

    1

    2

    3(위)

    2

    :

    :

    3

    3

  • 3) 등간척도

    등간척도(interval scale)

    사용되는 수가 집단, 순위 및 동등 간격이라고 하는 3종류의 정보를

    가지고 있는 자, 즉 척도

    예) 상품의 선호도, 온도계, IQ 점수, 심리검사점수 등

    등간척도의 예

    제3장 현상의 측정 4

    제1절 경영/경제현상 측정의의미

    변 수응답자 선호도 만족도 재구매의도

    응답자 1

    응답자 2

    :

    :

    응답자 99

    응답자 100

    5

    5

    :

    :

    4

    2

    5

    4

    :

    :

    4

    2

    5

    5

    :

    :

    3

    1

  • 4) 비율척도

    비율척도(ratio scale)

    사용되는 수(number)에 집단, 순서, 동일간격의 3종의 정보에다가 절대

    적인 0(absolute zero)이라고 하는 정보까지 포함한 가장 정보량이 많은

    유형의 자, 즉 척도

    0이 의미를 가지는 유형의 자 cf. 온도계(0도가 절대적인 기준점이 아님)

    예) 무게, 길이, 소득, 매출액, 이자율, 시험점수 등

    비율척도의 예

    제1절 경영/경제현상 측정의의미

    변 수응답자 국 어 영 어 수 학

    응답자 1

    응답자 2

    :

    :

    응답자 99

    응답자 100

    100

    95

    :

    :

    34

    12

    100

    94

    :

    :

    64

    0

    100

    85

    :

    :

    53

    1

  • 3. 측정과 통계학간의 관계

    1) 측정과 통계분석

    측정(measurement)과 통계학(statistics)은 유관한 별개의 학문분야

    측 정

    통계분석의 대상이 되는 ‘수를 공급하는 역할’을 수행

    통계학

    측정에 의해 ‘공급된 수들간의 관계를 분석’하는 역할 수행

    제3장 현상의 측정 6

    제1절 경영/경제현상 측정의의미

  • 2) 경영/경제현상의 연구와 근원척도 유형

    실제 연구에서는 4종류의 근원척도(primary scale)를 모두 사용해서

    현상을 측정하고 그 결과를 통계 분석하게 되는 것이 일반적

    경영현상의 측정(예)

    제3장 현상의 측정 7

    제1절 경영/경제현상 측정의의미

    경영현상(변수) 근원척도의유형

    직 위

    근무부서

    직무만족

    이직의사

    연봉

    근무연수

    명목척도 혹은 서열척도

    명목척도

    등간척도

    등간척도

    비율척도

    비율척도

  • 근원척도(primary scale)가 가진 정보의 종류와 양이 상이

    각 척도를 적용해서 수집된 자료를 분석하는 통계기법도 상이

    (분석 결과를 해석할 때에도 큰 영향을 받음)

    척도가 제공하고 있는 정보량이 많을수록 분석 가능성(분석할 정보량

    많아짐)도 높아짐

    가능한 한 많은 정보량을 가진 유형의 척도(즉, 가능하면 등간척도나

    비율척도)로 현상을 측정하는 것이 유리

    * 논란 : 서열척도와 등간척도 (태도, 지능지수)

    척도변환(scale transformation) : 많은 정보량을 가진 척도를 적은 정보량

    의 척도로 변환할 수 있지만, 반대 방향의 척도변환은 가능하지 않음

    제3장 현상의 측정 8

    제1절 경영/경제현상 측정의의미

  • 근원척도별 특성비교

    제3장 현상의 측정 9

    제1절 경영/경제현상 측정의의미

    척 도 제공정보 예 대표값 가능한통계분석기법

    명목척도 유목의 구분 주민등록번호

    성 별

    직 업

    최빈값 빈도분석

    교차분석

    비모수통계

    서열척도 유목의 구분

    순 위

    선호순위

    등수(학급, 경기)

    사회계층

    중앙값 서열상관분석

    비모수통계

    등간척도 유목의 구분

    순 위

    간격 비교

    선호도

    태도, 만족도

    IQ(지능지수),

    온도계

    평 균 모수통계

    비율척도 유목의 구분

    순 위

    간격 비교

    절대크기 비교

    매출액

    소 득

    이자율, 수익률

    나 이, 몸무게

    평 균 모수통계

  • 제3장 현상의 측정 10

    제1절 경영/경제현상 측정의의미

    ※ 표본자료의 요약과 평균

    주어진 표본자료를 일목요연하게 정리하는 것-> 기술통계학의 주된 관심사,

    그 중 특히 주어진 자료의 성격을 대표하는 하나의 대표값을 찾는 작업은

    기술통계학에서 가장 기본이 됨

    대표값으로 흔히 쓰이는 개념

    표본평균(sample mean): 장점은 주어진 자료를 모두 이용하여 대표값을 구

    한다는 점, but 터무니 없는 관측치 있을 때는 오히려 중앙값, 최빈값이 바

    람직할 수 있음

    중앙값(median), 최빈값(mode)

    -> 어떤 특정한 기준에 의해 선정된 하나의 관측치를 주어진 표본자료의 대표값

    으로 간주하기 때문에 다른 귀중한 정보가 손실되는 단점이 있음

    절사평균(trimmed mean): 자료의 양 극단의 관측치는 버리고 중간에 모여

    있는 나머지 관측치만을 대상으로 표본평균을 구하는 것, 표본평균의 단점

    을 보완, 극단적인 관측치 나타날 가능성이 높은 경우에 많이 사용

    예) 체조경기 채점, 미스코리아 채점

    * 계산적 대표치, 위치적 대표치

  • 자료(data)

    ‘현상의 질적(qualitative) 혹은 양적 속성(quantitative attributes)을 대변하

    는 측정(measurement)값의 집합’

    ‘추상적인 현상을 구체적인 수로 변환(즉, 측정)한 결과’

    ‘변수의 관측 값’

    1. 1차 자료와 2차 자료

    1) 1차 자료와 2차 자료의 구분

    1차 자료(primary data)

    연구문제 해결을 위해 새로 수집하는 자료

    2차 자료(secondary data)

    다른 목적의 연구를 위해 기존에 이미 수집된 모든 자료

    2차 자료를 이용하여 탐색적인 연구를 수행하고, 연구문제를 명확히 정의

    (및 가설설정)한 후 필요 시 1차 자료 수집을 통한 가설검정을 하는 것이 일

    반적인 연구과정

    제2절 자료의유형

  • 1차 자료와 2차 자료

    제3장 현상의 측정 12

    제2절 자료의유형

    1차 자료 2차 자료

    수집목적

    수집과정

    수집비용

    수집시간

    현 조사문제 해결

    많은 노력 필요

    높 음

    많은 시간 소요

    여타 조사문제 해결

    빠르고 쉬움

    낮 음

    짧은 시간 소요

    2) 2차 자료의유형

    연구자가 소속된 조직(학교, 기업, 연구소 등) 내에 존재하는지 여부 기준

    내부자료 vs. 외부자료

    외부자료

    공표자료, computer database와 상업용 자료

    2차 자료의 유형

    내부자료 외부자료

    ― 공표자료, computer database, 상업용 자료

  • (1) 공표자료(published data)

    누구나 자유롭게 이용할 수 있는 자료

    정부자료 + 비정부자료

    정부자료

    통계청, 재경부, 산자부, 건교부, 한국은행, 금융감독원 등의 (준)정부

    기관자료

    (2) Computer database

    각종 directory(기업연감 등), 통계자료(인구조사 자료 등), 조사연구자료

    (논문 등) 등

    (3) 상업용 자료(syndicated data)

    조사전문기업에서 주로 기업고객들을 대상으로 소비자, 유통기관 및

    산업관련 각종 자료를 수집해서 제공하는 2차 자료

    제3장 현상의 측정 13

    제2절 자료의유형

  • 2. 질적 자료와 계량적 자료

    계량적 자료(quantitative data)

    현상을 계량적인 의미(quantitative meaning)를 가지는 부호(symbol), 즉

    수(number)로 측정한(나타낸) 자료

    질적 자료(qualitative data)

    비계량적인 부호(즉 언어)로 측정한 자료

    계량적 자료와 질적 자료

    제2절 자료의유형

    계량적자료 질적 자료

    목 적현상간의 관계의 계량화

    현상간 관계의 일반화현상에 대한 깊은 이해

    표 본 대표성 있는 큰 표본 대표성 없는 작은 표본

    자료수집 구조화된 자료수집 구조화되지 않은 수집

    자료분석 통계분석 비통계분석

  • 기록에 의하면 자료의 수집은 상당히 오래 전부터 이루어졌습니다.

    다음의 예를 잘 감상해 봅시다.

    (A) 세종대왕은 한글창제뿐만 아니라, 우리나라에서 최초로 여론조사를 실시한

    것으로도 기록되고 있습니다.

    세종이 공법(세종 때 도입한 새로운 세법)을 실시하라고 발표하자 찬반논

    쟁이 치열하게 일어났다. 그러자 세종은 “찬성하는 사람도 반대하는 사람

    도 다 백성을 위해서라고 하는데, 그럼 직접 백성들에게 물어 보라”며 여론

    조사를 지시하였다. 관리에서부터 일반 농민에 이르기까지 무려 17만 명이

    참가한 여론조사는 찬성 9만 8,657명, 반대 7만 4,149명으로 판가름이 났

    다. 그러자 세종은 백성들을 위해 이 제도를 실시하겠노라고 선언하였다.

    -살아있는 한국사 교과서 1, 183쪽 –

    [도입사례]

    15

  • (B) 성경(The Holy Bible)에도 다음과 같은 자료조사와 관련된 구절이 있습니

    다.

    아훼께서 모세와 아론의 아들인 엘르아잘 사제에게 이르셨다. “이스라엘

    백성 온 회중 가운데 스무 살이 넘어 군대에 나갈 수 있는 남자의 수효를

    가문별로 세어라,” 모세와 엘르아질 사제는 예리고 가까이 요르단강가 모

    압 광야에서 그들의 수를 세었다.

    - 민수기 26장 1~3절 -

    (C) 한 독일의 정치사회학자가 고용주의 착취 정도를 파악하기 위해 약

    25,000부 정도의 설문지를 근로자들에게 우송한바 있었는데, 다음은 동설

    문지의 일부 내용입니다.

    “귀하의 고용주가 귀하 임금의 일부를 사취하기 위해 속임수를 쓰나요?”

    - Karl Marx (1880) -

    16

    생각해 볼 문제

    ① 경영/경제 현상을 측정하기 위한 자료는 누구를 대상으로 수집할까요? ② 자료의 수집방법에는 무엇이 있을까요?

  • 1. 자료수집대상 : 개인, 집단, 조직, 사회적 산출물이 됨

    * 연구자가 현상을 경험적으로 관찰하는 과정-> 자료수집 과정

    경영/경제 현상

    -> 사회적 실체(social entity), 인공물(artifacts 혹은 social artifacts)이 가진

    특성을 모두 포함

    개인(예: 소비자), 조직(예: 기업)과 같은 사회적 실체

    상품, idea 등과 같은 인공물(사회적 산출물)

    1) 개 인

    경영/경제현상 연구에서 가장 전형적인 분석단위(unit of analysis)

    주로 개인이 가진 속성(attribute)을 종합하고 설명

    예) 경영자, 직원, 소비자, 투자자 등

    2) 집 단

    예) 부부, 가족(family), 가구(household), 준거집단(reference group) 등

    17

    제1절 자료수집대상선정

  • 3) 조 직

    (1) 영리조직(for-profit organization): 기업 등

    (2) 비영리조직(not-for-profit organization): 병원, 정부, 교육기관, 종교기

    관 등

    4) 사회적 산출물

    각종 사회적 실체가 만들어낸 생산물, idea 혹은 행동 등

    예) 유형·무형의 각종 상품(product), 광고, 생활양식, 문화 등 실로 무한정

    바람직한 연구설계

    자료수집대상, 즉 분석단위를 명확히 하는 것

    예) ‘광고’ vs. ‘광고출연 연예인’, ‘기업’ vs. ‘기업구성원(경영인, 종업원)’

    18

    제1절 자료수집대상선정

  • 2. 전체조사 대 부분조사

    1) 전수조사(全數調査: census)

    자료수집대상 전체를 관찰하는 방법

    이상적(理想的: ideal) 방법

    예) 인구조사

    조사시간, 비용 그리고 물리적 가능성 면에서 현실적으로 실행 불가능

    전수조사 시 기 조사한 현상이 소멸 가능

    비표본오차(non-sampling error) 발생 가능 (pp.263~264 참고)

    조사대상의 파괴(destruction of object) 수반 시 적용 불가

    => 조사대상 현상이 무엇인가와 누구를 대상으로 조사하느냐에 따라

    전수조사 가능/바람직할 수도 있음

    예) 해당자가 극소수인 희귀한 질병 연구

    19

    제1절 자료수집대상선정

  • 2) 표본조사

    자료수집대상의 일부만을 관찰하고도 전체 자료수집대상에서 작동중인

    현상간의 관계 설명 가능 통계학의 도움 필요

    모집단(母集團: population)

    관심 있는 현상을 관찰할 수 있는 자료수집대상 전체

    표본(標本: sample)

    모집단의 일부

    전수조사

    모집단을 대상으로 조사하는 것

    표본조사

    표본(sample)을 대상으로 조사하는 것

    일반적으로 전수조사보다는 표본조사를 압도적으로 많이 사용

    전체 연구대상 중 일부를 ‘어떻게 추출(sampling)’하는가에 따라서

    표본조사의 대표성(representativeness) 확보 가능 (+ 비용대비 효과)20

    제1절 자료수집대상선정

  • 3. 표본추출

    1) 표본추출의 논리

    표본추출/표집(=sampling)

    전체(즉, 모집단) 자료수집대상에서 일부를 선정하는 것

    예) 표본조사에 기초한 미국 대통령선거결과 예측

    일부를 조사한 결과가 전체를 대표하기 위해서는 “모집단의 모든 구성원이

    표본에 속할 가능성이 동일한 경우에 그 표본은 모집단을 대표할 것”이란

    논리를 충실히 따라야 함

    21

    제1절 자료수집대상선정

  • 1996년도 미국 대통령선거 득표율(%)

    22

    제1절 자료수집대상선정

    후 보

    예측기관 Clinton Dole Perot 기 타

    CBS/NYT

    Reuter

    ABC

    NBC

    Gallup/CNN

    54

    49

    52

    51

    51

    35

    41

    39

    38

    38

    9

    8

    7

    9

    9

    2

    2

    2

    2

    2

    실제득표율 49 41 9 2

    * 유권자 9천만 명 중 자료수집대상 인원 약 2천명 (0.002%)

    • 출처 : 신민철 저 “경영경제 통계학의 기초, 창민출판사, 2010년.