본문 바로가기

분류 전체보기

(64)
PART 03 데이터 분석 - 1 1장 데이터 분석 개요1절 데이터 분석 기법의 이해1. 데이터 처리가. 개요 나. 활용 · 데이터 웨어하우스(DW)와 데이터 마트(DM)를 통해 분석 데이터를 가져옴 · 기존 운영시스템(Legacy)이나 스테이징 영역(Staging area)과 ODS(Operational Data Store)에서 데이터를 가져옴 · 가급적이면 클린징 영역인 ODS에서 데이터 전처리를 해서 DW나 DM 결합하여 활용하는 것이 가장 이상적 다. 최종 데이터 구조로 가공1) 데이터마이닝 분류 · 분류값과 입력변수들을 연관시켜 인구통계, 요약변수, 파생변수 등을 산출2) 정형화된 패턴 처리가) 비정형 데이터 · DBMS에 저장됬다가 텍스트 마이닝을 거쳐 데이터마트와 통합나) 관계형 데이터 · DBMS에 저장되어 사회 신경망 분..
PART 02. 데이터 분석 기획 1장 데이터 분석 기획의 이해1절 분석기획 방향성 도출1. 분석기획의 특징가. 분석기획이란?(계획수립) ˙ 실제 분석을 수행하기 앞서 분석을 수행할 과제를 정의하고, 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업나. 데이터 사언티스트의 역량 ˙ 데이터 사이언티스트는 수학/통계적 지식 및 정보기술(IT기술, 해킹기술, 통신기술 등) 뿐만 아니라 해당 비즈니스에 대한 이해와 전문성을 포함한 3가지 영역에 대한 고른 역량과 시각이 요구 2. 분석 대상과 방법분석의 대상(What)분석의 방법(How)KnownUn-Known → 분석 대상 및 분석 방법을 이해하고 현문제를 최적화 하는 형태로 수행 → 분석대상이 불분명하고, 분석방법을 알고 있는 경우 인사이트 ..
PART 01. 데이터 이해 1장. 데이터의 이해1절. 데이터와 정보1. 데이터의 정의와 특성가. 데이터의 정의 데이터(data)라는 용어는 1656년 영국 문헌에 처음 등장하였으며 라틴어인 dare(주다)의 과거 분사형으로 '주어진 것'이란 의미로 사용 나. 데이터의 특성구분특성존재적 특성 개별 데이터 자체로는 의미가 중요 X당위적 특성 다른 객체와의 상호관계 속에서 가치를 갖음 2. 데이터의 유형구분형태예특징 (qualitative data)언어, 문자 등회사 매출이 증가함 등 비정형 데이터 형식 X (quantitative data)수치, 도형, 기호 등나이, 몸무게, 추가 등 정형 데이터 형식 O 3. 지식경영의 핵심 이슈구분의미예특징상호작용암묵지학습과 경험을 통해 개인에게 체화 되있지만 겉으로 드러나지 않는 지식김장김치 담..
Elasticsearch shard와 node ◎ 샤드 : 클러스터를 구성하는 서버간 이동가능 ◎ Shard = 루신색인 ◎ Cluster에서 Shard 분산하기 ① horizontal scaling(수평적 확장) -> Cluster에 node를 추가하는 방법의 확장 -> node를 더 추가함으로써 요청이 분산되어, 모든 node가 공유 ② vertical scaling(수직적 확장) -> Elasticsearch node에 더 많은 자원을 추가 ex) RAM, HDD, CPU 증설 -> 성능에 도움이 되나 비용 효율적이지 않음 ◎ 분산색인(index 생성) ① 색인 요청을 받은 Elasticsearch node는 우선 document를 색인할 shard를 선택 -> 기본값으로 document는 shard에 골고루 분산 ② 각 document에 대해..
Elasticsearch Head설치 # Elasticsearch Head 1. 크롬에서 웹스토어에서 추가 2. https://github.com/mobz/elasticsearch-head mobz/elasticsearch-head A web front end for an elastic search cluster. Contribute to mobz/elasticsearch-head development by creating an account on GitHub. github.com 3. 접속확인 브라우서 URL 옆쪽에 아이콘 클릭 #Elasticsearch Head(github 이용) 1. Clone or download 클릭 후 Download ZIP 클릭 - git clone https://github.com/mobz/elasticsea..
Elasticsearch 데이터 구조 - 엘라스틱 서치의 구조는 Index, Type, Document 단위로 이루어져 있음 - Document는 Elasticsearch의 데이터가 저장되는 최소 단위 - 여러개의 Document는 하나의 Type을 구성 - 여러개의 Type은 하나의 Index로 구성 - 관계형 DB와 Elasticsearch의 데이터 구조 비교 관계형 DB Elasticsearch Database Index Table Type Row Document Column Field Schema Mapping - curl 을 이용한 REST API 호출 -> curl -X{Method} http://host:port/{Index}/{Type}/{Document id} -d '{JSON 데이터}' - HTTP Method는 GET, ..
Elaticsearch 설치 # 윈도우 1. https://www.elastic.co/kr/ 오픈소스 검색 및 분석· Elasticsearch | Elastic Elasticsearch 시작하기 실시간 데이터 분석과 검색을 경험해 보세요. www.elastic.co 2. 제품 -> 모든 다운로드 보기 3. Elarsticsearch -> 다운로드 클릭 4. Windows클릭 5. 설치경로에 압축 해제 6. JDK 1.8 이상 설치 및 환경변수 설정(elasticsearch 실행시 JDK1.9이상 설치를 권하는듯 함->실행시 문제 없음 ) - OpenJDK 64-it Server VM warning: Option UseConcMarkSweepGC was deprecated in version 9.0 and will likely be ..
[ADSP] R Studio설치 1. https://www.r-project.org/ 2. Korea를 검색한다. 3. 하단의 사이트중 임의 사이트를 클릭 하고 OS맞는 R링크를 클릭 4. base 클릭 5. Download R 3.6.2 for Windows 클릭 후 파일 실행 6. 한국어 선택 후 확인클릭 후 다음 클릭 7. 경로 설정 후 다음 클릭 8. 다음 클릭 9. 바로가기명 입력 후 다음클릭 후 다시 다음클릭 10. 완료클릭 # R Studio 설치 1. https://rstudio.com/ RStudio | Open source & professional software for data science teams RStudio provides free and open source tools for R and enterpris..