본문 바로가기
개발

파이썬을 이용한 텍스트 파일 데이터 처리와 분석 방법

by hes3518 2024. 11. 12.
728x90
반응형

안녕하세요! 오늘은 파이썬을 활용하여 간단한 텍스트 파일에서 데이터를 처리하고 분석하는 프로그램을 만들어 보겠습니다. 데이터 분석은 정보의 의미를 이해하는 데 매우 중요하며, 파이썬은 이 작업을 수행하는 데 최적의 언어 중 하나입니다.

들어가며
최근 데이터는 다양하고 방대하며 매일 생성되고 있습니다. 따라서 이 데이터를 어떻게 수집하고 분석하는가는 매우 중요한 질문입니다. 파이썬을 사용하면 텍스트 파일에서 데이터를 쉽게 읽고 필터링하며 기본적인 통계 기능을 수행할 수 있습니다. 여러분의 데이터 분석이 필요할 때 이 프로그램이 많은 도움이 될 것입니다.

자, 그럼 시작해볼까요?

코드 작성하기
이번 예제에서는 간단한 CSV 형식의 텍스트 파일을 읽고, 특정 조건을 만족하는 데이터를 필터링하여 출력해보겠습니다. 아래 코드를 살펴보세요.

import csv

# CSV 파일 경로
file_path = 'data.csv'

# 데이터 저장 리스트
filtered_data = []

# 파일 읽기
with open(file_path, mode='r') as file:
    reader = csv.reader(file)
    header = next(reader)  # 첫 줄은 헤더로 건너뜁니다.
    
    for row in reader:
        if float(row[1]) > 50.0:  # 두 번째 열의 값이 50 초과일 경우
            filtered_data.append(row)

# 결과 출력
for index, data in enumerate(filtered_data, start=1):
    print(f"{index}번째 데이터: {data}")

코드 설명하기

  • CSV 파일 읽기: csv 모듈을 사용하여 CSV 파일을 읽습니다. 이 예제에서는 data.csv라는 파일을 엽니다.
  • 데이터 필터링: 각 행을 검사하여 두 번째 열의 값이 50을 초과하는 경우에만 filtered_data 리스트에 추가합니다.
  • 결과 출력: 필터링된 데이터를 출력합니다.

예제 실행 결과
이 코드를 실행했을 때, 조건을 충족하는 데이터가 다음과 같이 출력됩니다.

1번째 데이터: ['Alice', '55.2', 'Category A']
2번째 데이터: ['Bob', '78.1', 'Category B']
3번째 데이터: ['Charlie', '90.3', 'Category C']

추가적으로
이 코드는 기본적인 데이터를 불러와 필터링하는 로직입니다. 이를 통해 필요한 분석 기능을 추가할 수 있습니다. 예를 들어:

  • 필터링된 데이터를 새로운 CSV 파일로 저장하는 기능 추가.
  • 평균, 최대, 최소 등의 통계 정보를 계산하는 기능 추가.
  • 시각화를 위해 matplotlib 등 라이브러리를 활용하여 그래프 출력.

마무리하며
오늘은 파이썬을 통해 텍스트 파일에서 데이터를 읽고 필터링하는 방법을 알아보았습니다. 실제 데이터가 어떻게 작동하는지를 이해하는 데에 큰 도움이 될 것입니다. 여러분도 다양한 데이터 파일을 활용해 보시기 바랍니다! 추가적인 질문이나 궁금한 점이 있으시면 댓글로 남겨주세요.

여러분의 데이터 분석 프로젝트에 이 코드가 유용하게 사용되길 바랍니다! 그럼 다음 포스트에서 만나요!

728x90
반응형