A função boost::split em C++

Jinku Hu 12 outubro 2023
  1. Use a função boost::split para tokenizar a string fornecida
  2. Use stringstream com a função getline para dividir a string com delimitadores
A função boost::split em C++

Este artigo irá demonstrar como usar a função boost::split em C++.

Use a função boost::split para tokenizar a string fornecida

Boost fornece ferramentas poderosas para estender a biblioteca padrão C++ com bibliotecas maduras e bem testadas. Este artigo explora a função boost::split, que faz parte da biblioteca de algoritmos de string Boost. O último inclui vários algoritmos de manipulação de string, como corte, substituição, etc.

A função boost::split divide a seqüência de string dada em tokens separados pelo delimitador. O usuário deve fornecer uma função de predicado que identifica o delimitador como o terceiro parâmetro. A função fornecida deve retornar true se o elemento fornecido for um delimitador.

No exemplo a seguir, especificamos um objeto de função isspace para identificar espaços no texto fornecido e dividi-los em tokens. boost::split também precisa de um contêiner de sequência de destino para armazenar sub-strings tokenizadas. Observe que o contêiner de destino é passado como o primeiro parâmetro e seu conteúdo anterior é sobrescrito após a chamada da função.

#include <boost/algorithm/string/split.hpp>
#include <iostream>
#include <sstream>
#include <string>
#include <vector>

using std::cin;
using std::cout;
using std::endl;
using std::string;
using std::vector;

int main() {
  string text = "Lorem ipsum  dolor sit amet, consectetur adipiscing elit.";
  vector<string> words;

  boost::split(words, text, isspace);
  for (const auto &item : words) {
    cout << item << "; ";
  }
  cout << endl;

  return EXIT_SUCCESS;
}

Produção:

Lorem; ipsum; ; dolor; sit; amet,; consectetur; adipiscing; elit.;

A chamada boost::split no fragmento de código anterior armazena strings vazias quando dois ou mais delimitadores estão próximos um do outro. Embora possamos especificar o quarto parâmetro opcional - boost::token_compress_on e os delimitadores adjacentes serão mesclados conforme mostrado no exemplo a seguir. Lembre-se de que as bibliotecas Boost devem ser instaladas no sistema se você deseja executar esses dois trechos de código com êxito.

#include <boost/algorithm/string/split.hpp>
#include <iostream>
#include <sstream>
#include <string>
#include <vector>

using std::cin;
using std::cout;
using std::endl;
using std::string;
using std::stringstream;
using std::vector;

int main() {
  string text = "Lorem ipsum  dolor sit amet, consectetur adipiscing elit.";
  vector<string> words;

  boost::split(words, text, isspace, boost::token_compress_on);
  for (const auto &item : words) {
    cout << item << "; ";
  }
  cout << endl;

  return EXIT_SUCCESS;
}

Produção:

Lorem; ipsum; dolor; sit; amet,; consectetur; adipiscing; elit.;

Use stringstream com a função getline para dividir a string com delimitadores

Alternativamente, pode-se empregar a classe stringstream e a função getline para dividir o texto com o delimitador de caractere fornecido. Nesse caso, utilizamos apenas ferramentas STL e não há necessidade de incluir cabeçalhos Boost. Observe que esta versão do código é mais volumosa e precisa de etapas extras para mesclar os caracteres delimitadores adjacentes.

#include <iostream>
#include <sstream>
#include <string>
#include <vector>

using std::cin;
using std::cout;
using std::endl;
using std::string;
using std::stringstream;
using std::vector;

int main() {
  string text = "Lorem ipsum  dolor sit amet, consectetur adipiscing elit.";
  vector<string> words;

  char space_char = ' ';
  stringstream sstream(text);
  string word;
  while (std::getline(sstream, word, space_char)) {
    words.push_back(word);
  }

  for (const auto &item : words) {
    cout << item << "; ";
  }
  cout << endl;

  return EXIT_SUCCESS;
}

Produção:

Lorem; ipsum; ; dolor; sit; amet,; consectetur; adipiscing; elit.;
Autor: Jinku Hu
Jinku Hu avatar Jinku Hu avatar

Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.

LinkedIn Facebook

Artigo relacionado - C++ Boost