Weighted choice implementation

2017-05-04T08:35:16+00:00

2017-05-04T09:17:28+00:00

Indeed, I did not know about the alias method. There was similar comments in the associated reddit post: https://www.reddit.com/r/cpp/comments/688xkk/implementing_a_weighted_choice_random_generator/. I will have a look at it when I get the change and improve my implementation.

	std::vector<Weighted<char>> weighted_letters = {
	{'a', 2}, {'b', 1}, {'c', 1}, {'d', 1}, {'e', 2}
	};

	auto weighted_letters_gen = weighted_choice_gen(weighted_letters);

	std::string vowels = "aeiouy";
	std::string consonants = "bcdfghjklmnpqrstvwxyz";

	auto vowels_gen = choice_gen(vowels);
	auto consonant_gen = choice_gen(consonants);

	auto weighted_letters_gen = weighted_one_of_gen(
	[](char c) { return c; },
	weighted(vowels_gen, 2),
	weighted(consonant_gen, 1));

	template<typename Value>
	struct Weighted
	{
	Value m_value;
	double m_weight;
	};

	template<typename Value>
	Weighted<Value> weighted(Value gen, double weight)
	{
	return Weighted<Value>{gen, weight};
	}

	template<typename Value>
	std::vector<std::pair<double, Value>> make_intervals(
	std::vector<Weighted<Value>> const& weighted_values)
	{
	std::vector<std::pair<double, Value>> intervals;
	intervals.reserve(weighted_values.size());

	double summed_weights = 0.0;
	for (auto const& weighted_value: weighted_values)
	{
	summed_weights += weighted_value.m_weight;
	intervals.emplace_back(summed_weights, weighted_value.m_value);
	}
	return intervals;
	}

	template<typename Value>
	Value search_containing_interval(
	std::vector<std::pair<double, Value>> const& intervals, double weight)
	{
	auto it = std::lower_bound(
	intervals.begin(), intervals.end(), weight,
	[](auto const& element, double weight)
	{
	return element.first < weight;
	});
	return it->second; //By construction, always exists
	}

2 thoughts on “Weighted choice implementation”

	template<typename Value>
	auto weighted_choice_gen(std::vector<Weighted<Value>> const& weighted_values)
	{
	auto const& intervals = details::make_intervals(weighted_values);
	double sum_weights = intervals.back().first;
	return [=](std::mt19937& bit_gen) -> Value
	{
	std::uniform_real_distribution<double> distribution(0., sum_weights);
	return details::search_containing_interval(intervals, distribution(bit_gen));
	};
	}

	template<typename Finalizer, typename Generator, typename... Generators>
	auto weighted_one_of_gen(
	Finalizer finalizer, Weighted<Generator> head, Weighted<Generators>... tail)
	{
	using Out = decltype(finalizer(head.m_value(std::declval<std::mt19937&>())));
	using OutGen = std::function<Out(std::mt19937&)>;

	auto map_first = [&](auto&& wg) -> Weighted<OutGen>
	{
	return Weighted<OutGen>{transform_gen(finalizer, wg.m_value), wg.m_weight};
	};

	std::vector<Weighted<OutGen>> weighted_gens{ map_first(head), map_first(tail)... };

	auto generator_picker = weighted_choice_gen(weighted_gens);
	return [=](std::mt19937& bit_gen)
	{
	return generator_picker(bit_gen)(bit_gen);
	};
	}