Detect Matches> library(data.table)> library(stringr) # 함수 실습을 위해 간단한 데이터테이블을 만든다.> string string member old1: mother 502: father 553: grandmother 804: grandfather 845: son 1 146: daughter 1 207: son 2 158: daughter 2 189: uncle 40 # str_detect(string, pattern) : 문자열(string)에서 pattern을 비교하여 진릿값(TRUE/FALSE) 를 알려준다.> str_detect(string$member, "mo")[1] TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE ..
데이터 분석에 앞서 이상치, 결측치를 확인해야 한다. 이상치, 결측지에 관한 포스팅은 다음으로 미루고 실습위주로 한다. 분석은 전 포스팅에 이어서 한다. 결측치 확인 및 결측치 채우기 패키지library(VIM) 결측치 확인> VIM::aggr(fullDT,+ prop=FALSE,+ numbers=TRUE,+ sortVars= TRUE,+ cex.axis = .7) Variables sorted by number of missings: Variable Count Cabin 1014 Survived 418 Age 263 Embarked 2 Fare 1 PassengerId 0 Pclass 0 Name 0 Sex 0 SibSp 0 Parch 0 Ticket 0 Variable Count Cabin 1014 ..
Data.frame(데이터 프레임)데이터 프레임 형식은 스프레드시트와 같은 형태로 보여지기 때문에 데이터 분석시 자주 사용된다. 또한 분석시 여러가지 장점이 있으며, 아래와 같은 특징이 있다.(1) 행과 열로 구성되어 있고, 2차원 구조이다.(2) 여러 개의 데이터 유형을 가질 수 있다.(3) 하나의 열은 하나의 데이터 유형만 갖는다.(4) 다른 열은 다른 데이터 유형을 가질 수 있다. 1. to make data.frame (데이터 프레임 생성)기본적으로 데이터 프레임은 벡터의 조합으로 생성할 수 있다. 응용방법을 통해 다양하게 생성 할 수 있지만 여기서는 기본적인 방법만 소개한다. # 벡터열로 데이터 프레임 조합 (vector1, vector2, matrix1,....) - 여기서 matrix는 벡터..
- Total
- Today
- Yesterday
- R
- 빅데이터
- 16.04
- 빅데이터분석전문가
- ADSP
- 실습
- 함수
- 우분투
- 병합
- Bigdata
- vector
- RStudio
- data.table
- data.frame
- Titanic
- rbase
- 타입
- Jupyter notebook
- 빅데이터분석
- 벡터
- 분석
- 기초
- 실기
- 데이터구조
- Kaggle
- 데이터분석
- subset
- ADP
- 리눅스
- 데이터형태
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |