Я пытаюсь разобрать файл CSV и извлечь данные только из определенных столбцов.
Пример CSV:
ID | Name | Address | City | State | Zip | Phone | OPEID | IPEDS |
10 | C... | 130 W.. | Mo.. | AL... | 3.. | 334.. | 01023 | 10063 |
Я пытаюсь захватить только определенные столбцы, скажем ID
, Name
, Zip
и Phone
.
Код, на который я посмотрел, заставил меня поверить, что я могу вызвать конкретный столбец по соответствующему номеру, то есть: Name
будет соответствовать, 2
и итерация по каждой строке с использованием row[2]
приведет к созданию всех элементов в столбце 2. Только это не так.
Вот что я сделал до сих пор:
import sys, argparse, csv
from settings import *
# command arguments
parser = argparse.ArgumentParser(description='csv to postgres',\
fromfile_prefix_chars="@" )
parser.add_argument('file', help='csv file to import', action='store')
args = parser.parse_args()
csv_file = args.file
# open csv file
with open(csv_file, 'rb') as csvfile:
# get number of columns
for line in csvfile.readlines():
array = line.split(',')
first_item = array[0]
num_columns = len(array)
csvfile.seek(0)
reader = csv.reader(csvfile, delimiter=' ')
included_cols = [1, 2, 6, 7]
for row in reader:
content = list(row[i] for i in included_cols)
print content
и я ожидаю, что при этом будут напечатаны только те столбцы, которые мне нужны для каждой строки, кроме случаев, когда я получаю только последний столбец.
"rb"
подходит для перехода на csv.reader
.
'rb'
флагopen()
? не должно ли быть простоr
?