Страуструп недавно опубликовал серию публикаций, разоблачающих популярные мифы о C ++ . Пятый миф: «C ++ предназначен только для больших, сложных программ». Чтобы разоблачить его, он написал простую программу на C ++, загружающую веб-страницу и извлекающую из нее ссылки . Вот:
#include <string>
#include <set>
#include <iostream>
#include <sstream>
#include <regex>
#include <boost/asio.hpp>
using namespace std;
set<string> get_strings(istream& is, regex pat)
{
set<string> res;
smatch m;
for (string s; getline(is, s);) // read a line
if (regex_search(s, m, pat))
res.insert(m[0]); // save match in set
return res;
}
void connect_to_file(iostream& s, const string& server, const string& file)
// open a connection to server and open an attach file to s
// skip headers
{
if (!s)
throw runtime_error{ "can't connect\n" };
// Request to read the file from the server:
s << "GET " << "http://" + server + "/" + file << " HTTP/1.0\r\n";
s << "Host: " << server << "\r\n";
s << "Accept: */*\r\n";
s << "Connection: close\r\n\r\n";
// Check that the response is OK:
string http_version;
unsigned int status_code;
s >> http_version >> status_code;
string status_message;
getline(s, status_message);
if (!s || http_version.substr(0, 5) != "HTTP/")
throw runtime_error{ "Invalid response\n" };
if (status_code != 200)
throw runtime_error{ "Response returned with status code" };
// Discard the response headers, which are terminated by a blank line:
string header;
while (getline(s, header) && header != "\r")
;
}
int main()
{
try {
string server = "www.stroustrup.com";
boost::asio::ip::tcp::iostream s{ server, "http" }; // make a connection
connect_to_file(s, server, "C++.html"); // check and open file
regex pat{ R"((http://)?www([./#\+-]\w*)+)" }; // URL
for (auto x : get_strings(s, pat)) // look for URLs
cout << x << '\n';
}
catch (std::exception& e) {
std::cout << "Exception: " << e.what() << "\n";
return 1;
}
}
Давайте покажем Страуструпу, что такое небольшая и читаемая программа.
- Скачать
http://www.stroustrup.com/C++.html
Перечислите все ссылки:
http://www-h.eng.cam.ac.uk/help/tpl/languages/C++.html http://www.accu.org http://www.artima.co/cppsource http://www.boost.org ...
Вы можете использовать любой язык, но сторонние библиотеки не допускаются.
победитель
Ответ C ++ выиграл голосами, но он опирается на стороннюю библиотеку (которая запрещена правилами), и вместе с другим близким конкурентом Bash полагается на взломанный вместе HTTP-клиент (он не будет работать с HTTPS, gzip, перенаправляет и т. д.). Так что Вольфрам явный победитель. PowerShell (с улучшением по комментариям) приближается к другому решению, которое приближается к размеру и удобочитаемости , но ему не уделяется особого внимания. Основные языки ( Python , C # ) тоже подошли довольно близко.
Content-Type: text/html; charset=UTF-8
... Я отправлю ему письмо.
boost/asio
используются там , который является библиотекой третьей стороны. Я имею в виду, как будут конкурировать языки, которые не включают выборку url / tcp как часть своей стандартной библиотеки?