1. Jupyter project Jupyter는 40여 가지의 다양한 프로그래밍 언어를 지원하고 오픈소스 소프트웨어이다. 개방형 표준 및 대화식 컴퓨팅을 위한 서비스를 개발하기 위해 존재한다.최초에는 Ipython notebook이라는 이름으로 Python 언어만 지원하였지만 이후에 다양한 언어를 지원하면서 Jupyter notebook으로 이름을 변경하였다. 2. AnacondaAnaconda는 세계에서 가장 유명한 파이썬(Python) 데이터 과학 플랫폼이다. 한 번의 클릭으로 모든 데이터 과학 패키지를 쉽게 설치하고 패키지, 종속성 및 환경을 관리할 수 있다. Anaconda에 Jupyter notebook이 포함되어있어서 Anaconda를 설치하면 Jupyter notebook를 사용할 수 있다..
1. 모집단 (Population) - 전체의 집합을 모집단(Population)이라고 한다. 2. 표본 (Sample) - 모집단에서 일부의 자료를 추출한 자료를 표본(Sample)이라고 한다. 3. 모집단과 표본의 관계 우리가 알고자 하는 즉, 관심의 대상이 되는 전체의 집단인 모집단(Population)을 정확히 알기 위해서는 모집단 전체를 전부 조사(전수조사) 해야 하나 이는 불가능하거나 경제적으로 곤란한 경우가 많다. 그래서 시간과 경제적 측면에서 모집단에서 일부의 자료를 추출한 표본(Sample)을 조사, 분석하여 모집단의 특성을 추측하거나 최종적인 결론(의사결정)을 한다. 예를 들어 한국 대학생과 일본 대학생의 IQ를 비교하고자 한다면, 모든 대학생들의 IQ를 측정하는 것은 불가능하기 때문에..
How to solve the problem in Ubuntu 16.04 Rstudio로 데이터 분석을 할 때 txt파일을 읽어와야 하는 경우가 많다. 윈도우에서 작성한 txt파일을 ANSI 인코딩 방식으로 저장하기 때문에 문제가 발생한다.그래서 우분투 문서 편집기 gedit이나 다른 편집기로 텍스트(txt)를 불러올 때 깨짐 현상이 발생합니다. 문제를 해결하기위해 gedit의 인코딩 방식을 재설정 해줘야 한다. 1. dconf-deitor 설치(gedit 인코딩 재설정) $ sudo apt-get install dconf-tools 2. 인코딩 변경 $ gsettings set org.gnome.gedit.preferences.encodings candidate-encodings"['UTF-8', 'U..
How to solve the problem in Ubuntu 16.04 ubuntu 16.04 에서 Rstudio 1.0.153 이상 버전에서 한글 입력 문제 해결방법입니다. 일본인 블로그에 해결방법이 있습니다. 1. fcitx-qt5-rstudio를 다운로드 및 배포 및 설치 $ wget http://ikuya.info/tmp/fcitx-qt5-rstudio-gt542.tar.gz$ tar xf fcitx-qt5-rstudio-qt542.tar.gz$ sudo apt install ./fcitx-frontend-qt5-rstudio_1.0.5-1ubuntu1 ~ qt542_amd64.deb ./libfcix-qt5-1-rstudio_1.0.5-1ubuntu1~qt542_amd64.deb
Basic-Operator Basic Matrix 1. 행렬(Matrix)행(row), 열(columns)로 구성된 2차원 구조이다.벡터처럼 하나의 데이터 유형만 가진다.벡터화(Vectorization), 재사용규칙(recycling)이 적용된다 1.1 행렬 만들기(To make matrix) 기본 : matrix(vector, nrow = , ncol = ) # nrow : 행의 개수 # nrow : 열의 개수 # 행부터 채운다(1) rbind(vector1, vector2, ...) # bind vector based on row > v1 v2 rbind(v1,v2) [,1] [,2] [,3] v1 1 2 3 v2 4 5 6 (2) cbind(vector1, vector2, ...)# bind vec..
- Total
- Today
- Yesterday
- 실기
- 데이터형태
- RStudio
- ADSP
- 빅데이터분석
- 리눅스
- ADP
- 벡터
- Bigdata
- Kaggle
- 우분투
- 함수
- subset
- 빅데이터
- 16.04
- 병합
- 타입
- 데이터분석
- rbase
- vector
- 분석
- Jupyter notebook
- data.table
- 기초
- 데이터구조
- data.frame
- 실습
- Titanic
- R
- 빅데이터분석전문가
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |