python - unicodedecodeerror 'ascii' codec can't decode byte

Programing/Python programming

python - unicodedecodeerror 'ascii' codec can't decode byte

sosal 2015. 9. 4. 21:58

* http://sosal.kr/
* made by so_Sal
*/

파이썬에서 file.readline() 함수 에러가 났다.

Traceback (most recent call last):
File "/mnt/fhgfs/sosal/TCGA/Source/bin/get_integrate_somatics_onlyone.py", line 28, in <module>
line = PR_file.readline()
File "/storage/home/sosal/anaconda3/lib/python3.4/encodings/ascii.py", line 26, in decode
return codecs.ascii_decode(input, self.errors)[0]
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe9 in position 6028: ordinal not in range(128)

나는 파일에서 '0xe9' 라는 녀석을 없애보려고 이것저것 노력을 했는데 (물론 hex edit까지 꺼내진 않았지만..)

라인을 제거해도 계속 UnicodeDecodeError가 났다.

결국 제거하지 못했단 뜻이지만 ㅋㅋ.. 어차피 저 0xe9라는 녀석은 필요하지 않은 데이터이기 때문에 (필요한 column만 추출하는 parsing 작업중이었다.), 읽기에만 성공한다면 된다! 라는 심정으로 해결방법을 모색해봤다.

결국 인코딩만 추가해주면 간단하게 끝나는 문제였다

PR_file = open(sys.argv[1], encoding='cp437')

이렇게 읽으니 저런 알수없는 데이터가 들어있어도 에러없이 잘 읽고 해결됐다. ㅋㅋ

굳이 file을 open할때 encoding을 바꿔주는것 말고도 다른 인코딩 설정방법도 있는것 같다.

아래 URL을 참조하시면 이 문제를 해결하는데 도움이 될 것 같다.

http://stackoverflow.com/questions/21129020/how-to-fix-unicodedecodeerror-ascii-codec-cant-decode-byte

출력에서 같은 에러가 나도 위 URL의 방법으로 해결이 가능하다고 한다.

저작자표시 비영리 변경금지 (새창열림)

'Programing > Python programming' 카테고리의 다른 글

python DICOM (DCM) 이미지를 png, jpg로 바꾸기 (2)	2017.10.01
Tensorflow-gpu No module named '_pywrap_tensorflow' 에러 (1)	2017.09.30
Python - 도형 class를 이용한 상속 예제 (0)	2015.06.03
Python - Recursion으로 구현하는 string compression (1)	2015.06.03
Python - DNA sequence로부터 protein 서열 구하기 (0)	2015.06.03

현재글python - unicodedecodeerror 'ascii' codec can't decode byte

so_sal　

Bioinformatics analyst Data scientist

아크로뱃, sosal, socket, PDF, binary, fork, 시스템, Linux, 링크드리스트, process, 어도비, 애크로뱃, adobe, Acrobat, system, 프로세스, Acrobat9, find, SIS, 리눅스,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

so_sal