SAS 자격증 준비하고 있다면? 고급명령어도 쉽게 분석하는 비결, 통계교육원 이러닝이 알려드립니다

>

분석 프로그램 사용을 두려워하시는 분, 복잡한 통계 분석에 머리가 지끈지끈 아프신 분이라면 주목해 주세요. 통계청에서는 국민들이 보다 쉽게 통계에 다가갈 수 있도록 다양한 통계 교육을 free로 제공해드리고 있음니다. SPSS부터 R프로그램, SAS, MDIS 등 통계를 공부하는 분이라면 꼭 알아둬야 할 분석 프로그램들을 배울 수 있죠.

>

통계교육원 ‘이러닝’에선 PC는 물론 모바일에서 교육 과정을 수료할 수 있도록 서비스하고 있는데요. 그중 오노상은 SAS 프로그램에 대해 소개해드리겠음니다. SAS는 처sound엔 통계분석시스템(Statistical Analysis System)의 약자로 쓰였지만, 요즈음엔 SAS 기능이 통합 발전되어 전략적 응용시스템(Strategic Application System)의 약자로 쓰이고 있어요. 이런 SAS의 변수생성 방법과 기본적인 함수, 고급명령어 활용법을 ‘이러닝’으로 함께 공부해 보시죠.

SAS왜 필요한가요?​본격적인 강의에 벌써, SAS가 필요한 이유를 살펴­보겠읍니다. 먼저 SAS는 자료 관리와 처리 효율성이 다른 패키지에 비해 높읍니다. 특히, 크기가 큰 자료를 읽거본인 쓸 때 유용한데요. 컴퓨터 언어를 이용하면 며칠씩이본인 걸리는 작업도 SAS를 이용하면 몇 줄의 코딩으로 간단하게 끝낼 수 있읍니다. 역시, 다양한 SAS 프로시저를 통해 초보자도 쉽게 복잡한 자료 처리와 고급 통계 분석을 할 수 있읍니다.​

>

정형화된 분석 과정을 SAS로 프로그래밍 해놓으면, 분석 시간을 줄일 수 있을 뿐만 아니라 대등한 분석을 할 때 재사용할 수 있다는 장점이 있읍니다. 고로 통계청을 비롯한 통계작성기관에서 사용하기 아주 좋은 프로그램임. 다만, 가격이 비싸고 프로그램의 용량이 커서 개인이 사용하기에는 부그다음이 있고, 범용성이 떨어진다는 단점이 있읍니다.​

SAS 데이터셋을 만드는유용한 기법​SAS를 이용하여 변수를 생성할 때에는 SAS에서 인식할 수 있는 방식으로 정의하면 되는데, 이는 수학에서 방정식을 표현하는 방식과 유사한다. 예를 들어 변수 y에 일률적으로 10을 더한 값을 새롭게 변수 y1으로 만들고 싶다면 y1 = y + 10; 이라고 입력하고 실행하면 됩니다. 등호의 왼쪽에는 새롭게 변수명을 지정하고, 오른쪽에는 기존의 변수들을 이용한 산술식이자신 SAS의 함수를 쓰는 방식임니다. ​SAS에는 100여 가지 정도의 기본적인 함수를 지원하고 있으며, 사용자는 정해진 형식을 이용하여 필요한 함수를 쉽게 사용할 수 있슴니다. 일반적인 함수 형식은 함수이름(인제, 인제, …)로 인제의 개수는 함수에 따라 정해져 있기도 하고 사용자가 필요한 만큼 자신열할 수도 있어요.​함수 이름은 흔히 원하는 계산방법 영문 약자로 만들어 놓았기 때문에 편리하게 사용할 수 있슴니다. 자주 사용되는 내장 함수명과 사용방법을 아래에서 확인해보세요.

고급명령어로데이터 처리 및 변수 생성 변환법​지금 데이터 셋을 생성하고 자료를 처리하는 간단한 노하우을 한번 봅시다. 고급명령어는 아니지만, 알고 있으면 편리한 명령어들도 함께 알아두세요.

>

첫 번째는 KEEP과 DROP 구문으로, 변수를 보관하거나쁘지않아 제외하고자 할 때 사용하는 명령어입니다. 위 그림의 KEEP 변수명; 에서 KEEP 차후에 지정한 변수명은 데이터 셋에 보관하고자 하는 변수들을 의미할것이다. 이 때, 지정하지 않은 변수들은 데이터 셋에서 제외됍니다. 반대로, 변수를 지우고자 할 때는 아래처럼 DROP 변수명; 구문을 사용할 수 있으며, DROP 차후에 지정된 변수들은 데이터 셋에서 제외됍니다.

>

>

이강으로는 조건별로 자료를 처리할 때 많이 사용하는 IF구문을 살펴보겠음니다. 첫 번째 IF 구문은 IF 조건 THEN 명령어; 형태로 IF 다소음의 조건을 만족하는 자료(관측치)에 대해, THEN다음의 명령어를 적용할 때 사용한다. 조건을 만족하지 않는 자료에 대해서는 위 그림과 같이 ELSE 문을 처음가하여 자료 처리를 할 수 있음니다. ​두 번째 IF구문은 IF 조건문;과 같이 THEN을 사용하지 않는 경우이다. IF 조건을 만족하는 관측치만을 이용하여 데이터 셋을 만들 때 사용한다.

마지막으로 데이터를 읽거나쁘지않아 저장할 때 자주 사용하는 INPUT과 OUTPUT 명령어를 소개하겠읍니다. INPUT은 데이터를 읽을 때, OUTPUT은 데이터를 저장할 때 사용하는 명령어로써, 앞 서 소개한 IF 구문과 다함께 아래의 예시를 통해 기능을 살펴­보겠읍니다.

>

위의 IF, ELSE 구문은 변수 id 값이 A일 경우엔 데이터셋 one에 저장하고, B일 경우엔 데이터셋 two에 저장하는 명령어임니다니다. 위의 프로그램을 실행하면 데이터 셋 One과 Two의 자료를 확인할 수 있는데, 하단의 결과처럼 id의 값에 따라 각각 다른 데이터 셋에 저장된 것을 알 수 있슴니다. ​이 외에도 함수의 사용, 데이터셋의 병합, 출력과 형식, 정렬과 회전 등 심히 자세한 예기은 통계교육원, 이러닝 ‘예제로 본 SAS’ 교육 과정에서 확인할 수 있슴니다. SAS 프로그램을 알가는 데 도움이 되셨본인요? 일반인이 수강 가능한 교육으로 통계 공부가 필요할 땐 언제든지 통계교육원 ‘이러닝’을 찾무척세요. 다음에도 유익한 교육으로 찾아뵙겠슴니다.

>

>