A função boost::split em C++
-
Use a função
boost::split
para tokenizar a string fornecida -
Use
stringstream
com a funçãogetline
para dividir a string com delimitadores
Este artigo irá demonstrar como usar a função boost::split
em C++.
Use a função boost::split
para tokenizar a string fornecida
Boost fornece ferramentas poderosas para estender a biblioteca padrão C++ com bibliotecas maduras e bem testadas. Este artigo explora a função boost::split
, que faz parte da biblioteca de algoritmos de string Boost. O último inclui vários algoritmos de manipulação de string, como corte, substituição, etc.
A função boost::split
divide a seqüência de string dada em tokens separados pelo delimitador. O usuário deve fornecer uma função de predicado que identifica o delimitador como o terceiro parâmetro. A função fornecida deve retornar true
se o elemento fornecido for um delimitador.
No exemplo a seguir, especificamos um objeto de função isspace
para identificar espaços no texto fornecido e dividi-los em tokens. boost::split
também precisa de um contêiner de sequência de destino para armazenar sub-strings tokenizadas. Observe que o contêiner de destino é passado como o primeiro parâmetro e seu conteúdo anterior é sobrescrito após a chamada da função.
#include <boost/algorithm/string/split.hpp>
#include <iostream>
#include <sstream>
#include <string>
#include <vector>
using std::cin;
using std::cout;
using std::endl;
using std::string;
using std::vector;
int main() {
string text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit.";
vector<string> words;
boost::split(words, text, isspace);
for (const auto &item : words) {
cout << item << "; ";
}
cout << endl;
return EXIT_SUCCESS;
}
Produção:
Lorem; ipsum; ; dolor; sit; amet,; consectetur; adipiscing; elit.;
A chamada boost::split
no fragmento de código anterior armazena strings vazias quando dois ou mais delimitadores estão próximos um do outro. Embora possamos especificar o quarto parâmetro opcional - boost::token_compress_on
e os delimitadores adjacentes serão mesclados conforme mostrado no exemplo a seguir. Lembre-se de que as bibliotecas Boost devem ser instaladas no sistema se você deseja executar esses dois trechos de código com êxito.
#include <boost/algorithm/string/split.hpp>
#include <iostream>
#include <sstream>
#include <string>
#include <vector>
using std::cin;
using std::cout;
using std::endl;
using std::string;
using std::stringstream;
using std::vector;
int main() {
string text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit.";
vector<string> words;
boost::split(words, text, isspace, boost::token_compress_on);
for (const auto &item : words) {
cout << item << "; ";
}
cout << endl;
return EXIT_SUCCESS;
}
Produção:
Lorem; ipsum; dolor; sit; amet,; consectetur; adipiscing; elit.;
Use stringstream
com a função getline
para dividir a string com delimitadores
Alternativamente, pode-se empregar a classe stringstream
e a função getline
para dividir o texto com o delimitador de caractere fornecido. Nesse caso, utilizamos apenas ferramentas STL e não há necessidade de incluir cabeçalhos Boost. Observe que esta versão do código é mais volumosa e precisa de etapas extras para mesclar os caracteres delimitadores adjacentes.
#include <iostream>
#include <sstream>
#include <string>
#include <vector>
using std::cin;
using std::cout;
using std::endl;
using std::string;
using std::stringstream;
using std::vector;
int main() {
string text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit.";
vector<string> words;
char space_char = ' ';
stringstream sstream(text);
string word;
while (std::getline(sstream, word, space_char)) {
words.push_back(word);
}
for (const auto &item : words) {
cout << item << "; ";
}
cout << endl;
return EXIT_SUCCESS;
}
Produção:
Lorem; ipsum; ; dolor; sit; amet,; consectetur; adipiscing; elit.;
Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.
LinkedIn Facebook