SAS 퍼센타일 값 매크로 변수에 할당하기. AAA 라는 데이터셋에서 qcnt, ccnt, ctr 변수의 퍼센타일 값을 구하고, 원하는 퍼센타일 값을 메크로 변수에 박아 넣는다. 이것들은 후에 원본 데이터셋의 아웃라이어 처리할 때 활용하기 좋다. proc univariate 의 pctlpts 문법을 몇 년 만에 쓰려니 기억이 잘 나지 않아 조금 헤맨 기념으로 기록 남.. 일/Data Mining 2013.02.18
2013 봄. 팀 회의. OEC 퍼실리테이션 하고 싶었다. 그래서 했는데, 만족스러웠다. 이 기분을 기억이 휘발되기 전에 기록으로 남긴다. 목적은 두 가지였다. 1. 서로에 대한 인간적인 이해 2. 업무에 대한 생각 공유 를 그냥 멍석 깔아놓고, 혹은 회식 자리에서, 하는 것도 물론 좋지만. 지금 우리 상황에서 시도해보고 싶.. 일/Data Mining 2013.02.14
2013 Daum 검색개발 경력공채 진입장벽이 다소 있다보니, 괜히 분야만 좁아진 상황에서 과연 인력이 얼마나 지원할지는 모르겠지만. 마찬가지로 좁은 바닥에서 이렇게 공개적으로 구인한다는 것은 나름 좋은 기회가 아닐까 하네요. 경력공채를 이렇게 대대적으로 하는 것도, 업계 전체로 보았을 때 나름 좋은 사인이 .. 일/Data Mining 2013.02.13
[SAS tip] ORACLE DB 연결에러. ELFCLASS64 > 상황. ERROR : libnnz10.so: wrong ELF class: ELFCLASS64 분석서버에서 oracle sqlplus 를 실행하는 데 아무런 문제가 없음. 분석서버 리스너 등록이 잘 되어 있는데도 불구하고 에러가 뜨며 연결이 되지 않는다. > 해법. Library 와 처리 bit가 다른 경우에 발생. sas가 32bit 라이센스이기 때문에. 오라클 .. 일/Data Mining 2012.12.27
[스크랩] PIG 관련 URL http://www.cloudera.com/wp-content/uploads/2010/01/IntroToPig.pdf http://pig.apache.org/docs/r0.7.0/piglatin_ref2.html http://pig.apache.org/docs/r0.9.2/func.html#replace load : 하둡서버의 파일을 LOAD load 파일경로 필드 구분자 지정 : A = LOAD 'student' USING PigStorage('\t') AS (name: chararray, age:int, gpa: float); filter : 지정된 조건을 내용을 .. 일/Data Mining 2012.10.16
coursera stanford machine learning 수업 좋다고 한다. 인터넷 무료 강의이긴 한데, 숙제도 있고 제출하면 채점도 해준단다. 다른 수업들도 괜찮다고. 다음에 함 들어보자~ https://www.coursera.org/category/stats 일/Data Mining 2012.09.17
SAS 2바이트 문자 매칭, kindex() vs kindexc() > 요약 약 700만 키워드 대상, 34개 외로운 자모음을 부분매칭 하였다. kindex 함수 : 8분 소요. kindexc 함수 : 76분 소요. 왜인지 모르겠당 -_- 문자/문자열 매칭은 웬만하면 SAS 쓰지 말고, 꼭 필요할 경우 되도록 index/kindex 함수 쓰자. > 상세 index합수와 indexc함수는 영어권 등 1byte 문자들을 위.. 일/Data Mining 2012.09.12
SAS 에서 문자열 정규식 매칭하기 : prxmatch prxparse regular expression data testkwd; infile datalines delimiter='09'x; length keyword $ 100; input keyword; datalines; 안녕하세요 이화경입니다 반갑습니다 람이는예뻐요 1번도이쁘고 2번도이쁘고 1233423452 000-0000-0000 전화번호테스트데이터 123.242.45.657 아이피테스트데이터 이 예시 코드는 숫자와 특수기호 등으로 이루어진 아래 키워.. 일/Data Mining 2012.07.14
Big Data, Hadoop, Pig. Data Mining. 늘 하던 이야기. 대용량 데이터에서 유용한 지식을 뽑는다. 가 메인이지만- 노가다 투성이인 그 작업은 데이터 용량이 커지며 리소스가 많이 들어간다. 하둡이 지향하는 것은 시간 단축이다. 서버 분산처리로 시간을 줄이는데, 유저가 분산처리를 쉽게 할 수 있도록 도와준다. 피.. 일/Data Mining 2012.05.10
[스크랩] 다음, B2B 사업 접는다 다음, B2B 사업 접는다 http://newslink.media.daum.net/news/20100825181120555 일/Portal & Net 2010.08.26