[SAS tip] SAS 데이터셋 생성시 compress 옵션 사용. SAS 데이터셋 생성시 compress 옵션을 사용함으로써 데이터 사이즈의 효율적인 관리 및 데이터 작업시간을 단축시킬 수 있다. < compress 옵션의 종류> 1. compress= YES | CHAR - 문자형(CHAR) 필드를 압축하는 옵션이다. - ORACLE 등에서 사용 가능한 가변길이(VARCHAR)형식이 SAS에 없기 때문에 용량이 낭비되는 현상.. 일/Data Mining 2008.03.17
[강의록] Data Mining : Concepts and Techniques , 2nd ed. 1) 데이터마이닝에 대해 공부하고 싶은데 볼만한 것 있을까? 2) 데이터마이닝 관련 강의를 급하게 좀 해야 하는데 강의자료를 새로 만들 시간이 없어. 뭐 없니? 두 유형의 분들꼐 추천해드리고 있는 자료입니다. 저자는 DB 쪽 베이스를 가지고 마이닝을 하시는 분으로, 저와는 다소 견해 차이가 있을 수.. 일/Data Mining 2008.02.22
[SAS tip] sas datetime value를 yyyymmddhhmmss 형식으로 변형하기. 1. 목적. sas datetime 값을, yyyymmddhhmmss 형식으로 변환합니다. ex. '1495222292'(viewer에 노출은 ' 01JAN1960:00:20:34'로 됨) -> '20070520111550' 로 변환. 2. 변환 대상 oracle 테이블의 'DATE' 타입 변수를 sas에서 열면, 실제 저장은 sas datetime 변수로 저장되고, format/inforamt 은 datetime20. 으로 표현됩니다. * sas datetime 변수 : '1495.. 일/Data Mining 2008.01.22
좋은 모델을 만드는 법. 대부분의 절차가 자동화 되어가고 있다. 회사에서 돈만 지불하면 패키지화 되어 있는 툴을 얼마든지 구입하여 사용할 수 있다. 설사 회사에서 구입하지 않는다 해도 어둠의 경로로 활용할 수 있는 길은 있다. 스스로 원하는 형태대로 데이터를 손질하고 가공할 수 있는 기술적인 기반은 충분히 갖추고.. 일/Data Mining 2007.12.16
'Data Mining' Talk을 듣고. 진희님 부탁으로 인트라넷에 올린 Talk 감상 겸 홍보 글. (중 편집하여 담음) ... 어째서 이화경은 글 짧게 쓰기가 안 될까=_= Simple is the BEST. =_= 노력할까? 과연-_- ++ [특강]Data Mining - I Still Know What You Did Last Summer - 심규석교수 (서울대) Data Mining 분야 자체가 나온 것은 여러가지 요인이 있겠지만, 데이터베.. 일/Data Mining 2007.05.11
Co-Training : Semi-Supervised Learning 석사 때 공부하며 정리했던 부분, Labeled Data를 얻기 힘든 현실에서 어떻게든 응용할 수 있는 방법이겠거니 생각할 수도 있지만, 일단 독립적인 두 개의 feature Set을 만들기도 어렵거니와, 그 두 개의 Classifier가 각각 제 몫을 해준다는 보장을 얻기도 힘들다. 하지만 어떻게든 웹 데이터 쪽에 응용해볼 수 .. 일/Data Mining 2007.05.05
역전파 알고리즘(Backpropagation) 개요 역전파 알고리즘(Backpropagation)은 다층(multilayer)이고, feedforward 신경망에서 사용되는 학습 알고리즘이며, 학습의 방법은 지도 학습(supervised learning)이다. 즉, 학습을 하기 위해서는 입력 데이터와 원하는 출력(o) 데이터가 있어야 한다. 간단히 학습의 개념을 살펴보면, 먼저, 입력이 신경망의 가중치(.. 일/Data Mining 2007.04.05
[퍼옴] 벡터의 내적과 외적 벡터의 내적과 외적, 법선벡터를 알자. 먼저 벡터의 내적과 외적을 알기전에 벡터에 대해 조금만 얘기하겠습니다. 당연히 수학적인 부분이지만 초등학생도 알수 있도록 쉽게.... 1. 벡터 2차원 좌표상에 점을 표시할때 일반적으로 x,y 두개의 좌표를 가지고 화면의 점을 그린다. 이때 수학적으로 점이란 .. 일/Data Mining 2007.04.05