'DataFrame' 태그의 글 목록 (2 Page)

« 2025/5 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

'DataFrame'에 해당되는 글 16건

2021.05.24 :: pandas read csv시 thousand 숫자형으로 읽기
2021.05.09 :: dataframe zero value column remove
2021.04.22 :: dataframe merge - reduce 이용
2020.09.06 :: [python] pandas dataframe append
2020.03.18 :: Pandas Big Data 다루기
2020.03.09 :: ValueError: If using all scalar values, you must pass an index

Python 2021. 5. 24. 13:23

pandas read csv시 thousand 숫자형으로 읽기

pd.read_csv('file',thousands=r',')

'Python' 카테고리의 다른 글

dataframe column에서 특정 단어 포함된 row 제외 (0)	2021.06.07
dataframe 범위별 구간 만들기 (0)	2021.06.02
plotly를 이용한 pca (0)	2021.05.18
dataframe zero value column remove (0)	2021.05.09
dataframe merge - reduce 이용 (0)	2021.04.22

posted by 초코렛과자

Python 2021. 5. 9. 14:01

dataframe zero value column remove

df.loc[:, (df != 0).any(axis=0)]

'Python' 카테고리의 다른 글

pandas read csv시 thousand 숫자형으로 읽기 (0)	2021.05.24
plotly를 이용한 pca (0)	2021.05.18
dataframe merge - reduce 이용 (0)	2021.04.22
seaborn boxplot 그리기 (0)	2021.04.13
[python] pandas dataframe append (0)	2020.09.06

posted by 초코렛과자

Python 2021. 4. 22. 14:18

dataframe merge - reduce 이용

import pandas as pd
from functools import reduce
dfs = [df0, df1, df2, dfN]
df_final = reduce(lambda left,right: pd.merge(left,right,on='key'), dfs)

기록

'Python' 카테고리의 다른 글

plotly를 이용한 pca (0)	2021.05.18
dataframe zero value column remove (0)	2021.05.09
seaborn boxplot 그리기 (0)	2021.04.13
[python] pandas dataframe append (0)	2020.09.06
Naver API를 이용한 쇼핑 최저가 검색 (0)	2020.06.09

posted by 초코렛과자

Python 2020. 9. 6. 19:00

[python] pandas dataframe append

dataframe row append 코드

df = pd.DataFrame(columns=['col1','col2','col3'])
data = [1,2,3]
df = df.append(pd.Series(data,index=df.columns), ignore_index=True)
print(df)
#  col1 col2 col3
#0    1    2    3

'Python' 카테고리의 다른 글

dataframe merge - reduce 이용 (0)	2021.04.22
seaborn boxplot 그리기 (0)	2021.04.13
Naver API를 이용한 쇼핑 최저가 검색 (0)	2020.06.09
pyinstaller를 이용한 python exe 만들기 (0)	2020.05.28
[python] PCA (0)	2020.04.09

posted by 초코렛과자

Python 2020. 3. 18. 22:21

Pandas Big Data 다루기

흔히 말하는 Big data 크기의 데이터를 다룰 일이 거의 없다보니 pandas를 이용해서 data를 load 하고 사용하는데 크게 불편한적은 없었다. 다만 이것저것 준비하는 과정에서 수십기가짜리 csv파일을 read_csv로 그냥 호출하면 메모리가 터지는 경우를 자주 볼 수 있었다. 그러다 찾은것이 바로 chunk size!

pandas에 read_csv를 보면 chunksize라는 파라미터가 있다.

import pandas as pd
df_chunk = pd.read_csv(r'/inputpath/file.csv', iterator=True, chunksize=1000000)

df = pd.concat([chunk for chunk in df_chunk])

아래 사이트에서 잘 설명중

http://acepor.github.io/2017/08/03/using-chunksize/

Using Chunksize in Pandas

Yet another blog about NLP, machine learning and programming

acepor.github.io

'Python' 카테고리의 다른 글

pyinstaller를 이용한 python exe 만들기 (0)	2020.05.28
[python] PCA (0)	2020.04.09
ValueError: If using all scalar values, you must pass an index (0)	2020.03.09
[Text 분석] Scikit-Learn의 문서 전처리 기능 (0)	2020.02.29
[Text 분석] 전처리 - URL, HTML, emoji, punctuations 삭제 함수 (0)	2020.02.29

posted by 초코렛과자

Python 2020. 3. 9. 22:36

ValueError: If using all scalar values, you must pass an index

dictionary를 pandas dataframe으로 만들 때 종종 나는 error.

이유는 모든 value가 scala로 되어있기 때문이라고 한다.

간단히 pd.DataFrame(target_dict, index=[0])

이걸 넣어주면 해결. 그 외에 다른 방법은 아래 블로그에 잘 설명되어있음

https://rfriend.tistory.com/482

[Python] pandas DataFrame: ValueError: If using all scalar values, you must pass an index 에러 해결 방법

이번 포스팅에서는 Python pandas DataFrame을 만들려고 할 때 "ValueError: If using all scalar values, you must pass an index" 에러 해결 방안 4가지를 소개하겠습니다. 아래의 예처럼 dictionary로 키, 값..

rfriend.tistory.com

'Python' 카테고리의 다른 글

[python] PCA (0)	2020.04.09
Pandas Big Data 다루기 (0)	2020.03.18
[Text 분석] Scikit-Learn의 문서 전처리 기능 (0)	2020.02.29
[Text 분석] 전처리 - URL, HTML, emoji, punctuations 삭제 함수 (0)	2020.02.29
[KoNLPy] 쉽고 간결한 한국어 정보처리 파이썬 패키지 (제 26회 한글 및 한국어 정보처리 학술대회 논문집 2014년) (0)	2019.08.25

posted by 초코렛과자

<PREV NEXT> 1 2

정리를 위한 블로그

Category

Notice

Tag

calendar

Recent Post

Recent Comment

Archive

My Link

'DataFrame'에 해당되는 글 16건

pandas read csv시 thousand 숫자형으로 읽기

'Python' 카테고리의 다른 글

dataframe zero value column remove

'Python' 카테고리의 다른 글

dataframe merge - reduce 이용

'Python' 카테고리의 다른 글

[python] pandas dataframe append

'Python' 카테고리의 다른 글

Pandas Big Data 다루기

'Python' 카테고리의 다른 글

ValueError: If using all scalar values, you must pass an index

'Python' 카테고리의 다른 글

티스토리툴바

정리를 위한 블로그

Category

Notice

Tag

calendar

Search

Recent Post

Recent Comment

Archive

My Link

'DataFrame'에 해당되는 글 16건

pandas read csv시 thousand 숫자형으로 읽기

'Python' 카테고리의 다른 글

dataframe zero value column remove

'Python' 카테고리의 다른 글

dataframe merge - reduce 이용

'Python' 카테고리의 다른 글

[python] pandas dataframe append

'Python' 카테고리의 다른 글

Pandas Big Data 다루기

'Python' 카테고리의 다른 글

ValueError: If using all scalar values, you must pass an index

'Python' 카테고리의 다른 글

티스토리툴바