하고자 하는 것

- 10개의 값을 랜덤하게 생성한다.

  그 중 0.5 이상인 값의 개수를 생성한다.

  다시 말해, 10개 값 중 0.5 이상인 개수가 나올 확률의 표본을 생성한다.

 

 

일반적인 방법

- 엑셀에서 rand() 함수를 이용하여 10개 값을 만든다.

  =RAND() 를 입력하면 0~1사이의 랜덤한 값이 생성된다.

  

   

 

 

 

 

 

 

 

 

 

 

- 생성된 10개 값 중, 0.5 이상인 값 개수를 센다

  K1 칸에 =COUNTIF(A1:J1,"<=0.5") 입력한다.

  COUNTIF 함수는 2개의 파라미터를 가지는데,

  첫 번째는 범위(range)로, A1에서 J1 칸까지 10개의 범위값을 넣어준다.

  두 번째는 기준(criteria) 또는 조건으로, "<=0.5", 즉, 0.5보다 큰 값을 counting 하라는 의미이다.

 

 

 

 

 

 

 

 

 

 

엑셀 '데이터분석' 이용한 방법

엑셀에서 '데이터분석' 기능을 사용하여

랜덤한 10개 값 중 0.5보다 큰 값의 개수를 얻는 방법은 아래와 같다.

 

엑셀에서, 데이터 탭 > 데이터 분석을 선택해야하는데,

보통은 아래와 같이 '데이터 분석' 항목이 없을 것이다.

 

'데이터 분석' 기능을 추가해보자

- 엑셀 메뉴에서 '파일'을 선택하면, 아래와 같이 보여질텐데,

  그 중 '옵션' 을 선택한다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Excel 옵션 창이 뜨면,

'추가기능'을 선택하고,

'이동' 버튼을 클릭한다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

추가기능 창이 뜰텐데,

'분석도구'를 체크하고,

'확인' 버튼을 클릭한다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

잠시 로딩이 생긴 후에,

데이터 탭 > 데이터 분석 항목이 생긴 것을 확인할 수 있다.

 

 

다시 데이터 분석 기능을 사용하는 방법으로 돌아와보자.

랜덤한 10개 값 중 0.5보다 큰 값의 개수를 얻기 위해서

데이터 분석을 클릭해보자.

 

통계 데이터 분석 창이 뜰텐데,

'난수 생성'을 선택하고, '확인'을 클릭한다.

 

 

 

 

 

 

 

 

 

 

난수 생성 창이 뜬다.

항목을 하나하나 살펴보자.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

- 변수의 개수 : 만들어질 데이터의 열 개수

- 난수의 개수 : 만들어질 데이터의 행 개수

간단히 예로 보면,

변수의 개수: 2, 난수의 개수: 10 를 입력했다고 하면,

2 X 10 = 20, 총 20개의 결과가 나오게 됩니다.

 

- 분포 : 이항 분포

이항분포란? 연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산확률분포

간단히 예로 보면,

주사위를 10회 던져서 숫자 6이 나오는 횟수를 센다. 이 분포는 n = 10이고 p = 1/6인 이항분포이다.

 

우리 상황에 대입해보자면,

10개의 난수를 독립적으로 발생시켜서, 0.5 이상인 값들이 발생한 값을 얻어내는 것이다.

 

- 성공률 : 0.5

- 시행 횟수 : 10

위에서 언급한대로, 10번 시행했을 때, 성공할 확률이 0.5 인 케이스

 

 

위 예시를 아래와 같이 입력한 후, '확인'을 클릭한다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

결과는 아래처럼

2 X 10, 총 20개의 값이 생성된다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

결론

앞서 일반적인 엑셀로 수행했던 과정을 돌이켜보면,

- 난수 10개 생성 (rand() 함수이용)

- 0.5 이상인 개수 세기 (countif() 함수이용)

 

위 과정을 데이터분석을 이용하여 표본을 보다 쉽게 만들어낼 수 있다.

앞서 일반적인 방법은 1개 표본 만드는데에 11칸을 사용했지만,

데이터분석 사용하면, 1칸에 1개씩 표본을 만들어낼 수 있다.

표본이 많이 필요할 수록, 데이터분석을 이용하는 것이 편할 것이다.

 

 

+ Recent posts