На странице сведений о кластере в разделе Load Metric Information
я вижу постоянно изменяющиеся значения для столбца Action
.
Он меняется от Creation
до CreationWithMove
и обратно за Count
, PrimaryCount
и ReplicaCount
. Для других записей он показывает NoActionNeeded
.Сведения о кластере в SF Explorer: информация о метрической нагрузке
Что это значит? И может ли это вызвать таймауты на стороне клиента, подключающиеся к кластеру?
Моего кластер манифест:
<NodeTypes>
<NodeType Name="NodeType0">
<Endpoints>
<ClientConnectionEndpoint Port="19000" />
<LeaseDriverEndpoint Port="19002" />
<ClusterConnectionEndpoint Port="19001" />
<HttpGatewayEndpoint Port="19080" Protocol="http" />
<ServiceConnectionEndpoint Port="19003" />
<ApplicationEndpoints StartPort="20001" EndPort="20031" />
<EphemeralEndpoints StartPort="20032" EndPort="20287" />
</Endpoints>
<PlacementProperties>
<Property Name="NodeTypeName" Value="NodeType0" />
</PlacementProperties>
</NodeType>
</NodeTypes>
<Infrastructure>
<WindowsServer>
<NodeList>
<Node NodeName="vm0" IPAddressOrFQDN="test.env.com" NodeTypeRef="NodeType0" FaultDomain="fd:/dc1/r0" UpgradeDomain="UD0" />
<Node NodeName="vm1" IPAddressOrFQDN="test.env.com" NodeTypeRef="NodeType0" FaultDomain="fd:/dc2/r0" UpgradeDomain="UD1" />
<Node NodeName="vm2" IPAddressOrFQDN="test.env.com" IsSeedNode="true" NodeTypeRef="NodeType0" FaultDomain="fd:/dc3/r0" UpgradeDomain="UD2" />
<Node NodeName="vm3" IPAddressOrFQDN="test.env.com" IsSeedNode="true" NodeTypeRef="NodeType0" FaultDomain="fd:/dc4/r0" UpgradeDomain="UD3" />
<Node NodeName="vm4" IPAddressOrFQDN="test.env.com" IsSeedNode="true" NodeTypeRef="NodeType0" FaultDomain="fd:/dc5/r0" UpgradeDomain="UD4" />
</NodeList>
</WindowsServer>
</Infrastructure>
<FabricSettings>
<Section Name="ClusterManager">
<Parameter Name="MinReplicaSetSize" Value="3" />
<Parameter Name="PlacementConstraints" Value="NodeTypeName==NodeType0" />
<Parameter Name="TargetReplicaSetSize" Value="3" />
</Section>
<Section Name="FailoverManager">
<Parameter Name="ExpectedClusterSize" Value="5" />
<Parameter Name="MinReplicaSetSize" Value="3" />
<Parameter Name="PlacementConstraints" Value="NodeTypeName==NodeType0" />
<Parameter Name="TargetReplicaSetSize" Value="3" />
</Section>
<Section Name="FaultAnalysisService">
<Parameter Name="MinReplicaSetSize" Value="3" />
<Parameter Name="PlacementConstraints" Value="NodeTypeName==NodeType0" />
<Parameter Name="TargetReplicaSetSize" Value="3" />
</Section>
<Section Name="Federation">
<Parameter Name="NodeIdGeneratorVersion" Value="V4" />
</Section>
<Section Name="Hosting">
<Parameter Name="EndpointProviderEnabled" Value="true" />
<Parameter Name="FirewallPolicyEnabled" Value="true" />
<Parameter Name="RunAsPolicyEnabled" Value="true" />
</Section>
<Section Name="HttpGateway">
<Parameter Name="IsEnabled" Value="true" />
</Section>
<Section Name="NamingService">
<Parameter Name="MinReplicaSetSize" Value="3" />
<Parameter Name="PlacementConstraints" Value="NodeTypeName==NodeType0" />
<Parameter Name="TargetReplicaSetSize" Value="3" />
</Section>
<Section Name="ReconfigurationAgent">
<Parameter Name="IsDeactivationInfoEnabled" Value="true" />
</Section>
<Section Name="Security">
<Parameter Name="ClientRoleEnabled" Value="true" />
<Parameter Name="ClusterCredentialType" Value="None" />
<Parameter Name="DisableFirewallRuleForDomainProfile" Value="true" />
<Parameter Name="DisableFirewallRuleForPrivateProfile" Value="true" />
<Parameter Name="DisableFirewallRuleForPublicProfile" Value="true" />
<Parameter Name="ServerAuthCredentialType" Value="None" />
</Section>
<Section Name="UpgradeOrchestrationService">
<Parameter Name="AutoupgradeEnabled" Value="True" />
<Parameter Name="ClusterId" Value="568fbf20-048e-43dc-828e-dd42df9c662f" />
<Parameter Name="MinReplicaSetSize" Value="3" />
<Parameter Name="PlacementConstraints" Value="NodeTypeName==NodeType0" />
<Parameter Name="TargetReplicaSetSize" Value="3" />
</Section>
</FabricSettings>
Я думаю, может быть целесообразно включить пример конфигурации JSON для вашей установки. Похоже, что один из ваших узлов может периодически разбиваться и воссоздаваться. Некоторые статьи в Интернете показывают, что средство просмотра диагностических событий может помочь вам найти причину (https://azure.microsoft.com/en-us/documentation/articles/service-fabric-diagnostics-how-to-monitor-and-diagnose-services -локально /). Некоторые другие идеи с моей головы ... вы используете балансировщик нагрузки, который временно аннулирует некоторые из связанных адресов ваших узлов? Вы используете меньше узлов, чем должны быть? – Alexandru
@Alexandru 1) узлы не сбой, я на 90% уверен; 2) нет балансировщика нагрузки - на кластере помещений; 3) Я использую кластер из 5 узлов, поэтому его должно быть достаточно, но можно увидеть препятствия с поиском места для реплик только после обновления, а не после первого развертывания. Будет добавлен мой конфиг чуть позже. – cassandrad
@ Александру добавил манифест. – cassandrad