So erstellen Sie eine Liste von ganzzahligen Zufallsvektoren mit der Summe x

Question

Jul 08, 2012, 05:41 AM

So erstellen Sie eine Liste von ganzzahligen Zufallsvektoren mit der Summe x

Das Erstellen eines Zufallsvektors mit der Summe X (z. B. X = 1000) ist ziemlich einfach:

import random
def RunFloat():
    Scalar = 1000
    VectorSize = 30
    RandomVector = [random.random() for i in range(VectorSize)]
    RandomVectorSum = sum(RandomVector)
    RandomVector = [Scalar*i/RandomVectorSum for i in RandomVector]
    return RandomVector
RunFloat()

Der obige Code erstellt einen Vektor, dessen Werte float und dessen Summe 1000 ist.

Ich habe Schwierigkeiten beim Erstellen einer einfachen Funktion zum Erstellen eines Vektors, dessen Werte Ganzzahlen sind und dessen Summe X ist (z. B. X = 1000 * 30).

import random
def RunInt():
    LowerBound = 600
    UpperBound = 1200
    VectorSize = 30
    RandomVector = [random.randint(LowerBound,UpperBound) for i in range(VectorSize)]
    RandomVectorSum = 1000*30
    #Sanity check that our RandomVectorSum is sensible/feasible
    if LowerBound*VectorSize <= RandomVectorSum and RandomVectorSum <= UpperBound*VectorSum:
        if sum(RandomVector) == RandomVectorSum:
            return RandomVector
        else:
            RunInt()

Hat jemand Vorschläge, um diese Idee zu verbessern? Mein Code wird möglicherweise nie beendet oder es treten Probleme mit der Rekursionstiefe auf.

Bearbeiten (9. Juli 2012)

Vielen Dank an Oliver, mgilson und Dougal für ihre Beiträge. Meine Lösung ist unten gezeigt.

Oliver war sehr kreativ mit der Idee der multinomialen DistributionEinfach ausgedrückt: (1) gibt mit größerer Wahrscheinlichkeit bestimmte Lösungen aus als andere. Dougal hat anhand eines einfachen Test- / Zählerbeispiels für das Gesetz der großen Zahlen gezeigt, dass die Raumverteilung der multinomialen Lösung nicht einheitlich oder normal ist. Dougal schlug auch vor, die Multinomialfunktion von numpy zu verwenden, was mir viel Ärger, Schmerzen und Kopfschmerzen erspart.Um das Ausgabeproblem von (2) zu überwinden, verwende ich RunFloat (), um das, was angezeigt wird (ich habe es nicht getestet, es ist also nur ein oberflächliches Erscheinungsbild), einheitlicher zu verteilen. Wie groß ist der Unterschied zu (1)? Ich weiß es nicht so recht. Es ist aber gut genug für meinen Gebrauch.Nochmals vielen Dank an mgilson für die alternative Methode, bei der Numpy nicht verwendet wird.

Hier ist der Code, den ich für diese Bearbeitung gemacht habe:

Bearbeiten # 2 (11. Juli 2012)

Mir ist aufgefallen, dass die Normalverteilung nicht korrekt implementiert ist. Ich habe sie seitdem folgendermaßen geändert:

import random
def RandFloats(Size):
    Scalar = 1.0
    VectorSize = Size
    RandomVector = [random.random() for i in range(VectorSize)]
    RandomVectorSum = sum(RandomVector)
    RandomVector = [Scalar*i/RandomVectorSum for i in RandomVector]
    return RandomVector

from numpy.random import multinomial
import math
def RandIntVec(ListSize, ListSumValue, Distribution='Normal'):
    """
    Inputs:
    ListSize = the size of the list to return
    ListSumValue = The sum of list values
    Distribution = can be 'uniform' for uniform distribution, 'normal' for a normal distribution ~ N(0,1) with +/- 5 sigma  (default), or a list of size 'ListSize' or 'ListSize - 1' for an empirical (arbitrary) distribution. Probabilities of each of the p different outcomes. These should sum to 1 (however, the last element is always assumed to account for the remaining probability, as long as sum(pvals[:-1]) <= 1).  
    Output:
    A list of random integers of length 'ListSize' whose sum is 'ListSumValue'.
    """
    if type(Distribution) == list:
        DistributionSize = len(Distribution)
        if ListSize == DistributionSize or (ListSize-1) == DistributionSize:
            Values = multinomial(ListSumValue,Distribution,size=1)
            OutputValue = Values[0]
    elif Distribution.lower() == 'uniform': #I do not recommend this!!!! I see that it is not as random (at least on my computer) as I had hoped
        UniformDistro = [1/ListSize for i in range(ListSize)]
        Values = multinomial(ListSumValue,UniformDistro,size=1)
        OutputValue = Values[0]
    elif Distribution.lower() == 'normal':
        """
        Normal Distribution Construction....It's very flexible and hideous
        Assume a +-3 sigma range.  Warning, this may or may not be a suitable range for your implementation!
        If one wishes to explore a different range, then changes the LowSigma and HighSigma values
        """
        LowSigma    = -3#-3 sigma
        HighSigma   = 3#+3 sigma
        StepSize    = 1/(float(ListSize) - 1)
        ZValues     = [(LowSigma * (1-i*StepSize) +(i*StepSize)*HighSigma) for i in range(int(ListSize))]
        #Construction parameters for N(Mean,Variance) - Default is N(0,1)
        Mean        = 0
        Var         = 1
        #NormalDistro= [self.NormalDistributionFunction(Mean, Var, x) for x in ZValues]
        NormalDistro= list()
        for i in range(len(ZValues)):
            if i==0:
                ERFCVAL = 0.5 * math.erfc(-ZValues[i]/math.sqrt(2))
                NormalDistro.append(ERFCVAL)
            elif i ==  len(ZValues) - 1:
                ERFCVAL = NormalDistro[0]
                NormalDistro.append(ERFCVAL)
            else:
                ERFCVAL1 = 0.5 * math.erfc(-ZValues[i]/math.sqrt(2))
                ERFCVAL2 = 0.5 * math.erfc(-ZValues[i-1]/math.sqrt(2))
                ERFCVAL = ERFCVAL1 - ERFCVAL2
                NormalDistro.append(ERFCVAL)  
            #print "Normal Distribution sum = %f"%sum(NormalDistro)
            Values = multinomial(ListSumValue,NormalDistro,size=1)
            OutputValue = Values[0]
        else:
            raise ValueError ('Cannot create desired vector')
        return OutputValue
    else:
        raise ValueError ('Cannot create desired vector')
    return OutputValue
#Some Examples        
ListSize = 4
ListSumValue = 12
for i in range(100):
    print RandIntVec(ListSize, ListSumValue,Distribution=RandFloats(ListSize))

Den obigen Code finden Sie aufGithub. Es ist Teil einer Klasse, die ich für die Schule gebaut habe. user1149913, hat auch eine nette Erklärung des Problems gepostet.