У меня есть текстовый файл, содержащий твиты, и я должен подсчитать, сколько раз слово упоминается в твите. Например, файл содержит:
Apple iPhone X is going to worth a fortune
The iPhone X is Apple's latest flagship iPhone. How will it pit against it's competitors?
И скажем, я хочу посчитать, сколько раз слово iPhone упоминается в файле. Итак, вот что я попробовал.
cut -f 1 Tweet_Data | grep -i "iPhone" | wc -l
это конечно работает, но я запутался насчет команды 'wc' в unix. Какая разница, если я попробую что-то вроде:
cut -f 1 Tweet_Data | grep -c "iPhone"
где вместо этого используется -c? Оба из них дают разные результаты в большом файле, полном твитов, и я не понимаю, как это работает. Какой метод является правильным способом подсчета происшествия?
cut -f1
резка на основе вкладок, что здесь мало что дает. Вы уверены, чтоwc -l
это действительно дает вам правильный счет? Здесь будет показано 2, но я считаю 3 экземпляра «айфона».